\chapter{矩阵}
\section{矩阵的概念}\label{section:2.1}


\begin{definition}
	由 $mn$ 个数 $a_{ij} (i = 1, 2, \cdots, m; \ j = 1, 2, \cdots, n)$ 排成 $m$ 行、$n$ 列的矩形阵列：
	\[
	\begin{pmatrix}
		a_{11} & a_{12} & \cdots & a_{1n} \\
		a_{21} & a_{22} & \cdots & a_{2n} \\
		\vdots & \vdots & \ddots & \vdots \\
		a_{m1} & a_{m2} & \cdots & a_{mn}
	\end{pmatrix}
	\]
	称为 $m$ 行 $n$ 列矩阵,简称为 $m \times n$ 矩阵（或 $m \times n$ 阵）.
\end{definition}


$a_{ij} (i = 1, 2, \cdots, m; \ j = 1, 2, \cdots, n)$ 称为矩阵 $A$ 的元素,前一个下标 $i$ 表示这个元素在第 $i$ 行,后一个下标 $j$ 表示这个元素在第 $j$ 列.$a_{ij}$ 称为矩阵 $A$ 的第 $i$ 行第 $j$ 列元素,或简称为 $A$ 的第 $(i, j)$ 元素.矩阵的元素通常用英文小写字母表示或直接用数字表示.

如果矩阵 $A$ 的元素全是实数,则称 $A$ 为实矩阵；如果 $A$ 的元素含复数,则称 $A$ 为复矩阵.所有元素均为零的矩阵,叫零矩阵,记为 $O$.但是必须注意这个 $O$ 不是一个数,而是一个矩阵.有时为了强调这是一个 $m \times n$ 阵,可写为 $O_{m \times n}$.

若矩阵的行列数相等,则称之为方阵.含有 $n$ 行及 $n$ 列的矩阵称为 $n$ 阶方阵（亦称为 $n$ 阶矩阵）,行列数不相等的矩阵称为长方阵.方阵在矩阵理论中有特别重要的位置.若 $A = (a_{ij})$ 是 $n$ 阶方阵,则元素 $a_{11}, a_{22}, \cdots, a_{nn}$ 称为 $A$ 的主对角线.若一个方阵除了主对角线上的元素外其余元素都等于零,就称之为对角矩阵.对角阵的形状为
\[
A = \begin{pmatrix}
	a_{11} & 0 & 0 & \cdots & 0 \\
	0 & a_{22} & 0 & \cdots & 0 \\
	0 & 0 & \ddots & \cdots & 0 \\
	0 & 0 & 0 & \ddots & 0 \\
	0 & 0 & 0 & \cdots & a_{nn}
\end{pmatrix}
\]
上述对角阵可简记为 $\text{diag}(a_{11}, a_{22}, \cdots, a_{nn})$.若进一步有 $a_{11} = a_{22} = \cdots = a_{nn} = 1$,则称这个矩阵为单位阵.$n$ 阶单位矩阵通常记为 $I_n$：
\[
I_n = \begin{pmatrix}
	1 & 0 & 0 & \cdots & 0 \\
	0 & 1 & 0 & \cdots & 0 \\
	0 & 0 & \ddots & \cdots & 0 \\
	0 & 0 & 0 & \ddots & 0 \\
	0 & 0 & 0 & \cdots & 1
\end{pmatrix}.
\]

一个 $n$ 阶方阵,如果它的主对角线以下的元素都等于零,即它具有下列形状：
\[
A = \begin{pmatrix}
	a_{11} & a_{12} & \cdots & a_{1n} \\
	0 & a_{22} & \cdots & a_{2n} \\
	\vdots & \vdots & \ddots & \vdots \\
	0 & 0 & \cdots & a_{nn}
\end{pmatrix},
\]
则称 $A$ 为上三角阵.同样地,若 $A$ 的主对角线以上的元素全为零,则称 $A$ 为下三角阵.下三角阵的形状为
\[
A = \begin{pmatrix}
	a_{11} & 0 & 0 & \cdots & 0 \\
	a_{21} & a_{22} & 0 & \cdots & 0 \\
	\vdots & \vdots & \ddots & \cdots & 0 \\
	a_{n1} & a_{n2} & \cdots & a_{nn}
\end{pmatrix}
\]

我们定义了矩阵的概念.从定义可以看出,矩阵可以是各种各样的.为了判断其异同,我们必须说明什么时候两个矩阵相等.简单地说,两个矩阵相等要求它们“完全一样”.即若 $A = (a_{ij})_{m \times n}, B = (b_{ij})_{s \times t}$,则 $A = B$ 当且仅当 $m = s, n = t$, 且 $a_{ij} = b_{ij}$ 对所有 $i, j$ 都成立.换言之,两个矩阵相等要求它们含有相同数目的行及相同数目的列, 且第 $(i, j)$ 元素都对应相等.

矩阵相等的概念并不复杂,但有时也会产生混淆.比如下面两个矩阵:
\[
\begin{pmatrix}
	0 & 0 \\
	0 & 0
\end{pmatrix}, \quad \begin{pmatrix}
	0 & 0 & 0 \\
	0 & 0 & 0
\end{pmatrix}
\]
都是零矩阵且常用同一个符号表示,但它们不相等.因为一个是 $2 \times 2$ 矩阵,另一个是 $2 \times 3$ 矩阵.下面两个矩阵也不相等,虽然它们都是二阶矩阵且都含有两个 $0$ 与两个 $1$:
\[
\begin{pmatrix}
	1 & 1 \\
	0 & 0
\end{pmatrix}, \quad \begin{pmatrix}
	1 & 0 \\
	0 & 1
\end{pmatrix}.
\]

矩阵的每一行称为这个矩阵的一个行向量,同样它的每一列称为它的一个列向量.一个 $1 \times n$ 矩阵:
\[
(a_1, a_2, \cdots, a_n)
\]
称为 $n$ 维行向量；一个 $n \times 1$ 矩阵:
\[
\begin{pmatrix}
	a_1 \\
	a_2 \\
	\vdots \\
	a_n
\end{pmatrix}
\]
称为 $n$ 维列向量.



记$M_{n}(\mathbb{R})$为$n$阶实方阵全体构成的集合,定义映射
\begin{align*}
	\det :& M_n(\mathbb{R}) \rightarrow \mathbb{R}\\
		&A \mapsto |A| = \det (A)
\end{align*}
即每一个方阵都有一个行列式与之对应.


接下来主要研究两个问题:
\begin{itemize}
	\item $n$阶行列式的值在多大程度上反映$n$阶方阵的性质?
	\item 映射$\det $具有怎样的性质?
\end{itemize}


\section{矩阵的运算}

\begin{definition}[矩阵加法]
	 设有两个 $m \times n$ 矩阵 $A = (a_{ij}), B = (b_{ij})$,定义 $A + B$ 是一个 $m \times n$ 矩阵且 $A + B$ 的第 $(i, j)$ 元素等于 $a_{ij} + b_{ij}$,即
	\[
	A + B = (a_{ij} + b_{ij}).
	\]
	
\end{definition}


例如
\[
\begin{pmatrix}
	1 & 2 & 0 \\
	-1 & 3 & 1
\end{pmatrix}
+
\begin{pmatrix}
	1 & -2 & 1 \\
	-1 & -3 & 0
\end{pmatrix}
=
\begin{pmatrix}
	2 & 0 & 1 \\
	-2 & 0 & 1
\end{pmatrix}.
\]

在进行矩阵加法时需特别注意,相加的两个矩阵的行数与列数必须分别对应相等.凡不满足这个条件的矩阵是不可以相加的.

一个 $m \times n$ 矩阵 $A$ 与一个 $m \times n$ 零矩阵相加显然仍等于 $A$,即
\[
A + O = A.
\]

因此零矩阵在矩阵加法中的作用与数字 $0$ 在数的加法中的作用类似.

矩阵的减法可以看做是矩阵加法的逆运算,因此行数与列数分别相等的两个矩阵才可以相减.

若 $A = (a_{ij})_{m \times n}, B = (b_{ij})_{m \times n}$,则
\[
A - B = (a_{ij} - b_{ij}).
\]



两个相等的矩阵相减为零矩阵,即若 $A = B$,则
\[
A - B = O.
\]

我们还可以定义负矩阵,设 $A = (a_{ij})$,定义 $-A = (-a_{ij})$.显然
\[
A + (-A) = O.
\]

\textbf{矩阵加减法运算规则}\quad 矩阵的加减法运算适合下列规则：
\begin{enumerate}[(1)]
	\item 交换律：$A + B = B + A$；
	\item 结合律：$(A + B) + C = A + (B + C)$；
	\item $O + A = A + O = A$；
	\item $A + (-B) = A - B$.
\end{enumerate}






\begin{definition}[矩阵数乘]
	设 $A$ 是一个 $m \times n$ 矩阵,$A = (a_{ij})_{m \times n}$,$c$ 是一个数,定义 $cA = (ca_{ij})_{m \times n}$.$cA$ 称为数 $c$ 与矩阵 $A$ 的数乘.
\end{definition}

上述定义告诉我们：一个数与一个矩阵的数乘等于将这个数乘以矩阵的每一项（即每个元素）所得的矩阵.例如：
\[
3 \cdot
\begin{pmatrix}
	1 & 1 \\
	3 & 0 \\
	0 & 1
\end{pmatrix}
=
\begin{pmatrix}
	3 & 3 \\
	9 & 0 \\
	0 & 3
\end{pmatrix}.
\]

矩阵 $A$ 的负矩阵也可以看成是 $-1$ 与 $A$ 的数乘.

\textbf{矩阵数乘运算规则}\quad 矩阵的数乘运算适合下列规则：
\begin{enumerate}[(1)]
	\item $c(A + B) = cA + cB$；
	\item $(c + d)A = cA + dA$；
	\item $(cd)A = c(dA)$；
	\item $1 \cdot A = A$；
	\item $0 \cdot A = O$.
\end{enumerate}






\begin{definition}
	设有 $m \times k$ 矩阵 $A = (a_{ij})_{m \times k}$,以及 $k \times n$ 矩阵 $B = (b_{ij})_{k \times n}$.定义 $A$ 和 $B$ 的乘积 $AB$ 是一个 $m \times n$ 矩阵且 $AB$ 的第 $(i, j)$ 元素
	\[
	c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{ik}b_{kj}=\sum_{r=1}^{k}a_{ir}b_{rj} .
	\]
\end{definition}

为了使读者看得更清楚,我们写出矩阵乘积的表达式：
\[
\begin{pmatrix}
	a_{11} & a_{12} & \cdots & a_{1k} \\
	a_{21} & a_{22} & \cdots & a_{2k} \\
	\vdots & \vdots & \ddots & \vdots \\
	a_{m1} & a_{m2} & \cdots & a_{mk}
\end{pmatrix}
\cdot
\begin{pmatrix}
	b_{11} & b_{12} & \cdots & b_{1n} \\
	b_{21} & b_{22} & \cdots & b_{2n} \\
	\vdots & \vdots & \ddots & \vdots \\
	b_{k1} & b_{k2} & \cdots & b_{kn}
\end{pmatrix}
=
\begin{pmatrix}
	\sum_{r=1}^{k} a_{1r}b_{r1} & \sum_{r=1}^{k} a_{1r}b_{r2} & \cdots & \sum_{r=1}^{k} a_{1r}b_{rn} \\
	\sum_{r=1}^{k} a_{2r}b_{r1} & \sum_{r=1}^{k} a_{2r}b_{r2} & \cdots & \sum_{r=1}^{k} a_{2r}b_{rn} \\
	\vdots & \vdots & \ddots & \vdots \\
	\sum_{r=1}^{k} a_{mr}b_{r1} & \sum_{r=1}^{k} a_{mr}b_{r2} & \cdots & \sum_{r=1}^{k} a_{mr}b_{rn}
\end{pmatrix}.
\]

\begin{remark}
	为了掌握这个定义,我们需要注意以下两个要点：
	
	第一,$A$ 和 $B$ 只有在 $A$ 的列数等于 $B$ 的行数时才可以相乘,这时的积写为 $AB$（注意不能写为 $BA$）.得到的积矩阵 $AB$ 的行数等于 $A$ 的行数,列数等于 $B$ 的列数.我们用下列式子来帮助记忆：
	\[
	\begin{array}{c}
		A \quad B \quad \longrightarrow \quad AB, \\
		m \times k \quad k \times n \quad \longrightarrow \quad m \times n,
	\end{array}
	\]
	即 $AB$ 的行列数只需把 $A$ 与 $B$ 的行列数合并去掉中间的两个 $k$ 就可以了.
	
	第二,$A$ 与 $B$ 的积 $AB$ 的第 $(i, j)$ 元素为
	\[
	c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{ik}b_{kj}.
	\]
	
	上述公式只涉及 $A$ 的第 $i$ 行元素与 $B$ 的第 $j$ 列元素.也就是说 $c_{ij}$ 等于将 $A$ 的第 $i$ 行元素与 $B$ 的第 $j$ 列元素分别相乘后再求和的结果.
	
	第三,矩阵乘法不满足交换律.
\end{remark}




\begin{example}
	\[
	A = \begin{pmatrix}
		0 & 0 \\
		0 & 1
	\end{pmatrix}, \quad B = \begin{pmatrix}
		0 & 1 \\
		0 & 0
	\end{pmatrix},
	\]
	求 $AB$ 和 $BA$.
\end{example}
\begin{solution}
	\[
	AB = \begin{pmatrix}
		0 & 0 \\
		0 & 0
	\end{pmatrix}, \quad BA = \begin{pmatrix}
		0 & 1 \\
		0 & 0
	\end{pmatrix}.
	\]
\end{solution}



在这个例子中,$A, B$ 都是二阶方阵,但 $AB$ 是零矩阵,$BA$ 不是零矩阵,因此 $AB \neq BA$.


\textbf{矩阵乘法运算规则}\quad 矩阵乘法运算适合下列规则：
\begin{enumerate}[(1)]
	\item 结合律: $(AB)C = A(BC)$；
	\item 分配律: $A(B + C) = AB + AC$, $(A + B)C = AC + BC$；
	\item $c(AB) = (cA)B = A(cB)$,这里 $c$ 是一个数；
	\item 对任意的 $m \times n$ 阶矩阵 $A$,$I_m A = A = AI_n$,其中 $I_m$ 和 $I_n$ 分别是 $m$ 阶和 $n$ 阶单位矩阵.即单位矩阵在矩阵乘法运算中起的作用和数 $1$ 在数字运算中起的作用类似.
\end{enumerate}

\begin{proof}
	(1) 结合律(只需证明两侧的第($i,j$)元素相同即可).
	
	首先我们注意到,由于 $A$ 与 $B$ 可相乘,$B$ 与 $C$ 也可相乘,因此可设 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times p$ 矩阵,$C$ 是 $p \times q$ 矩阵.于是,$AB$ 是一个 $m \times p$ 矩阵,$(AB)C$ 是一个 $m \times q$ 矩阵.另一方面 $BC$ 是一个 $n \times q$ 矩阵,$A(BC)$ 是一个 $m \times q$ 矩阵.因此只需验证两个 $m \times q$ 矩阵的任意第 $(i, j)$ 元素对应相等就可以了.现设 $A = (a_{ij})_{m \times n}$, $B = (b_{ij})_{n \times p}$, $C = (c_{ij})_{p \times q}$.矩阵 $(AB)C$ 的第 $(i, j)$ 元素可以看成是 $AB$ 的第 $i$ 行元素与 $C$ 的第 $j$ 列元素对应相乘之和,而 $AB$ 的第 $i$ 行的元素为
	\[
	\left( \sum_{r=1}^{n} a_{ir}b_{r1}, \sum_{r=1}^{n} a_{ir}b_{r2}, \cdots, \sum_{r=1}^{n} a_{ir}b_{rp} \right),
	\]
	
	$C$ 的第 $j$ 列为
	\[
	\begin{pmatrix}
		c_{1j} \\
		c_{2j} \\
		\vdots \\
		c_{pj}
	\end{pmatrix},
	\]
	因此,$(AB)C$ 的第 $(i, j)$ 元素为
	\[
	\left( \sum_{r=1}^{n} a_{ir}b_{r1} \right) c_{1j} + \left( \sum_{r=1}^{n} a_{ir}b_{r2} \right) c_{2j} + \cdots + \left( \sum_{r=1}^{n} a_{ir}b_{rp} \right) c_{pj}
	= \sum_{k=1}^{p} \left( \sum_{r=1}^{n} a_{ir}b_{rk} \right) c_{kj} = \sum_{k=1}^{p} \sum_{r=1}^{n} a_{ir}b_{rk} c_{kj}.
	\]
	
	另一方面,用同样方法可以求得 $A(BC)$ 的第 $(i, j)$ 元素为
	\[
	\sum_{r=1}^{n} a_{ir} \left( \sum_{k=1}^{p} b_{rk}c_{kj} \right) = \sum_{r=1}^{n} \sum_{k=1}^{p} a_{ir}b_{rk}c_{kj}.
	\]
	
	由于
	\[
	\sum_{k=1}^{p} \sum_{r=1}^{n} a_{ir}b_{rk}c_{kj} = \sum_{r=1}^{n} \sum_{k=1}^{p} a_{ir}b_{rk}c_{kj},
	\]
	因此有
	\[
	(AB)C = A(BC).
	\]
\end{proof}



我们还可以定义同一矩阵的幂方（即幂）.记
\begin{align*}
	A^2 &= A \cdot A,\\
	A^3 &= A \cdot A \cdot A,\\
	&\cdots \\
	A^k &= A \cdot A \cdot \cdots \cdot A \quad (k \text{ 个 } A).
\end{align*}

要使 $A$ 的乘方有意义,$A$ 的行数必须等于列数,也就是说 $A$ 必须是方阵.

\textbf{方阵幂的运算规则}
\begin{enumerate}[(1)]
	\item $A^r A^s = A^{r+s}$；
	\item $(A^r)^s = A^{rs}$.
\end{enumerate}

由于矩阵的乘法不满足交换律,因此一般来说若 $r > 1$,$(AB)^r \neq A^r B^r$.只有当 $AB = BA$ 时才有 $(AB)^r = A^r B^r$.虽然矩阵乘法不可交换,但对于某些特殊的矩阵,乘法仍是可以交换的.比如由矩阵乘法的运算规则 (4) 知 $I_n$ 可以与任一 $n$ 阶方阵相交换,事实上,若 $c$ 是某个数,则 $cI_n$ 与任一 $n$ 阶方阵乘法可以交换.当 $AB = BA$ 时,不难验证“二项式定理”也成立：
\[
(A + B)^n = A^n + \binom{n}{1}A^{n-1}B + \binom{n}{2}A^{n-2}B^2 + \cdots + \binom{n}{n-1}AB^{n-1} + B^n.
\]

矩阵乘法除了不可交换是它的一个特点外,还有一个特点是两个非零矩阵相乘其积可能为零矩阵.这一点由前面的例子我们已经看到了.由于这个缘故,对矩阵的乘法来说,消去律一般不成立.即若 $AB = AC, A \neq 0$,我们不能推出 $B = C$.何时可用消去律,我们将在后面讨论.

同时,整性一般也不成立,即若$A\ne 0,B\ne 0$,无法得到$AB \ne 0$.




矩阵的转置与行列式的转置定义是类似的.
\begin{definition}[矩阵的转置]
	设 $A = (a_{ij})$ 是 $m \times n$ 矩阵,定义 $A$ 的转置 $A'$ 为一个 $n \times m$ 矩阵,它的第 $k$ 行正好是矩阵 $A$ 的第 $k$ 列 $(k = 1, 2, \cdots, n)$；它的第 $r$ 列是 $A$ 的第 $r$ 行 $(r = 1, 2, \cdots, m)$.
\end{definition}



\textbf{矩阵转置运算规则}
\begin{enumerate}[(1)]
	\item $(A')' = A$；
	\item $(A + B)' = A' + B'$；
	\item $(cA)' = cA'$；
	\item $(AB)' = B'A'$.
\end{enumerate}
\begin{proof}
	上述 (1) $\sim$ (3) 是显然的,现来证明 (4).只需证明两侧的第$(i,j)$元素相同即可.
	
	$(AB)'$的第$(i,j)$元素为$AB$的第$(j,i)$元素 = $A$的第$j$行 $\cdot $ $B$的第$i$列.
	
	$B'A'$的第$(i,j)$元素 = $B'$的第$i $行 $\cdot $ $A'$的第$j$列 = $B$的第$i $列 $\cdot $ $A$的第$j$列.
	
	于是有$(AB)' = B'A'$.
\end{proof}



一个矩阵经转置以后得到的矩阵一般来说与原矩阵不同.如果一个方阵转置后仍与原矩阵相同,即 $A' = A$,则称这样的矩阵为对称矩阵.例如,下列矩阵为对称矩阵：
\[
\begin{pmatrix}
	1 & 1 & 0 \\
	1 & 3 & 5 \\
	0 & 5 & -1
\end{pmatrix}.
\]

若一个方阵经转置后等于原矩阵的负矩阵,即 $A' = -A$,就称它是一个反对称矩阵.例如,下列矩阵为反对称矩阵：
\[
\begin{pmatrix}
	0 & 2 & 1 \\
	-2 & 0 & -5 \\
	-1 & 5 & 0
\end{pmatrix}.
\]




对称阵特别是实对称阵我们今后还要进行仔细研究.读者不难看出,对称阵的元素以主对角线为对称线,即 $a_{ij} = a_{ji}$；反对称阵主对角线上的元素皆为零,且 $a_{ij} = -a_{ji}$.




复矩阵还有一种运算,称为共轭运算.设 $z$ 是一个复数,$z = a + bi$,我们用 $\overline{z}$ 表示 $z$ 的共轭复数 $a - bi$.

\begin{definition}[矩阵共轭]
	设 $A = (a_{ij})_{m \times n}$ 是一个复矩阵,则 $A$ 的共轭矩阵 $\overline{A}$ 是一个 $m \times n$ 复矩阵,且
	\[
	\overline{A} = (\overline{a_{ij}})_{m \times n}.
	\]
\end{definition}

这就是说 $A$ 的共轭矩阵的每个第 $(i, j)$ 元素是 $A$ 的第 $(i, j)$ 元素的共轭复数.例如
\[
A = \begin{pmatrix}
	1 + i & 0 & 1 + \sqrt{2}i \\
	2i & -1 & -4i \\
	-4 - i & \sqrt{3}i & i
\end{pmatrix},
\]
则
\[
\overline{A} = \begin{pmatrix}
	1 - i & 0 & 1 - \sqrt{2}i \\
	-2i & -1 & 4i \\
	-4 + i & -\sqrt{3}i & -i
\end{pmatrix}.
\]


\textbf{矩阵共轭运算规则}
\begin{enumerate}[(1)]
	\item $\overline{A + B} = \overline{A} + \overline{B}$；
	\item $\overline{cA} = \overline{c} \overline{A}$；
	\item $\overline{AB} = \overline{A} \, \overline{B}$；
	\item $\overline{(A')} = (\overline{A})'$.
\end{enumerate}


\section{方阵的逆阵}

\begin{definition}[逆矩阵]
	设 $A$ 是 $n$ 阶方阵,若存在一个 $n$ 阶方阵 $B$,使得
	\[
	AB = BA = I_n,
	\]
	则称 $B$ 是 $A$ 的逆阵,记为 $B = A^{-1}$.凡有逆阵的矩阵称为可逆阵或非奇异阵（简称非异阵）,否则称为奇异阵.
\end{definition}


矩阵的求逆运算有它自己的特点,我们必须注意：
\begin{enumerate}
	\item 根据上述定义,只有对方阵才有逆阵的定义,长方阵没有逆阵.
	\item 并非任一非零方阵都有逆阵.例如,矩阵
	\[
	A = \begin{pmatrix}
		1 & 1 \\
		0 & 0
	\end{pmatrix}
	\]
	就没有逆阵.因为对任一 $B = (b_{ij})_{2 \times 2}$,有
	\[
	AB = \begin{pmatrix}
		1 & 1 \\
		0 & 0
	\end{pmatrix}
	\begin{pmatrix}
		b_{11} & b_{12} \\
		b_{21} & b_{22}
	\end{pmatrix}
	= \begin{pmatrix}
		b_{11} + b_{21} & b_{12} + b_{22} \\
		0 & 0
	\end{pmatrix}.
	\]
	$AB$ 不可能是单位阵.
	
	\textbf{注}\quad 从这里我们可以发现,若某个矩阵有一行元素全等于零,则这个矩阵一定不是可逆阵.同理不难证明,若某个矩阵的一列全等于零,则该矩阵也必不是可逆阵.
	\item 由于矩阵的乘法一般不满足交换律,因此一般来说,$AB^{-1} \neq B^{-1}A$,即右除不一定等于左除.
\end{enumerate}






一个 $n$ 阶方阵 $A$ 若有逆阵,则逆阵唯一吗？设 $B, C$ 是 $n$ 阶方阵,且都是 $A$ 的逆阵,即
\[
AB = BA = I_n, \quad AC = CA = I_n,
\]
则
\[
B = BI_n = B(AC) = (BA)C = I_nC = C.
\]
因此只要矩阵可逆,其逆阵必唯一.

\textbf{矩阵求逆运算规则}
\begin{enumerate}[(1)]
	\item 若 $A$ 是非异阵,则 $(A^{-1})^{-1} = A$；
	\item 若 $A, B$ 都是 $n$ 阶非异阵,则 $AB$ 也是 $n$ 阶非异阵且 $(AB)^{-1} = B^{-1}A^{-1}$；
	\item 若 $A$ 是非异阵,$c$ 是非零数,则 $cA$ 也是非异阵且 $(cA)^{-1} = c^{-1}A^{-1}$；
	\item 若 $A$ 是非异阵,则 $A$ 的转置 $A'$ 也是非异阵且 $(A')^{-1} = (A^{-1})'$.
	\item 对可逆阵而言,乘法消去律满足.若$A$可逆,则有
	\[\begin{cases}
		AB=AC \to B=C\\
		BA=CA \to B=C
	\end{cases}\]
	\item 整性对可逆矩阵成立,即若$A$可逆,且$B\neq 0$,有$AB\neq 0,BA\neq 0$.
\end{enumerate}


\begin{proof}
	\begin{enumerate}[(1)]
		\item 因为 $(A^{-1})A = A(A^{-1}) = I_n$,故 $A$ 是 $A^{-1}$ 的逆阵.
		\item 我们有
		\[
		(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = AI_nA^{-1} = AA^{-1} = I_n.
		\]
		同理 $(B^{-1}A^{-1})(AB) = I_n$.
		\item 显然.
		\item 由 $AA^{-1} = I_n$,两边转置并注意到 $I_n' = I_n$,得
		\[
		(AA^{-1})' = I_n.
		\]
		但由转置的性质知
		\[
		(AA^{-1})' = (A^{-1})'A'
		\]
		因此
		\[
		(A^{-1})'A' = I_n
		\]
		同理可得
		\[
		A'(A^{-1})' = I_n
		\]
		\item 由于$AB=AC$,同时左乘$A_{-1}$即可得到$B=C$.
		\item (反证法)若$AB=0$,由于$A$可逆,同时左乘$A^{-1}$,则有$B=0$,矛盾.故$AB\neq 0$.
	\end{enumerate}
\end{proof}


用数学归纳法容易证明：\label{可逆矩阵的乘积}
\[
(A_1 A_2 \cdots A_k)^{-1} = A_k^{-1} \cdots A_2^{-1} A_1^{-1},
\]
其中每个 $A_i$ 都是可逆阵.

如何求逆阵？我们介绍一个方法.
设 $A$ 是 $n$ 阶方阵,这个方阵决定了一个 $n$ 阶行列式记为 $|A|$ 或 $\det A$.若 $A = (a_{ij})_{n \times n}$,则
\[
|A| = \begin{vmatrix}
	a_{11} & a_{12} & \cdots & a_{1n} \\
	a_{21} & a_{22} & \cdots & a_{2n} \\
	\vdots & \vdots & \ddots & \vdots \\
	a_{n1} & a_{n2} & \cdots & a_{nn}
\end{vmatrix}
\]

\begin{definition}[伴随矩阵]
	设 $A$ 是 $n$ 阶方阵,$A_{ij}$ 是行列式 $|A|$ 中第 $(i,j)$ 元素 $a_{ij}$ 的代数余子式,则称下列方阵为 $A$ 的伴随阵：
	\[
	\begin{pmatrix}
		A_{11} & A_{21} & \cdots & A_{n1} \\
		A_{12} & A_{22} & \cdots & A_{n2} \\
		\vdots & \vdots & \ddots & \vdots \\
		A_{1n} & A_{2n} & \cdots & A_{nn}
	\end{pmatrix}
	\]
	$A$ 的伴随阵通常记为 $A^*$.
\end{definition}

\begin{remark}
	伴随矩阵是原矩阵每一个元素所对应的代数余子式所构成矩阵的转置,即在求伴随矩阵时可以按行求代数余子式,按照列来放(按行求,按列放).
	
	每一个矩阵都有伴随矩阵.
	
	
\end{remark}

\begin{corollary}\label{corollary:2.1}
	对于二阶方阵,通过伴随矩阵定义,可以很容易写出其伴随矩阵.设
	\[A = \begin{pmatrix}
		a&b\\
		c&d
	\end{pmatrix}\]
	则其伴随矩阵为
	\[A^* = \begin{pmatrix}
		d&-b\\
		-c&a
	\end{pmatrix}\]
	即主对角线交换位置,副对角线取相反数.
\end{corollary}
\begin{proof}
	根据伴随矩阵的定义即可得到.
\end{proof}



方阵与其伴随阵之间有如下的关系：

\begin{lemma}\label{lemma:2.1}
	设 $A$ 为 $n$ 阶方阵,$A^*$ 为 $A$ 的伴随阵,则
	\[
	AA^* = A^*A = |A| \cdot I_n.
	\]
\end{lemma}
\begin{proof}
	直接使用矩阵乘法定义,即可得到
	\[
	AA^* = \begin{pmatrix}
		a_{11} & a_{12} & \cdots & a_{1n} \\
		a_{21} & a_{22} & \cdots & a_{2n} \\
		\vdots & \vdots & \ddots & \vdots \\
		a_{n1} & a_{n2} & \cdots & a_{nn}
	\end{pmatrix}
	\cdot
	\begin{pmatrix}
		A_{11} & A_{21} & \cdots & A_{n1} \\
		A_{12} & A_{22} & \cdots & A_{n2} \\
		\vdots & \vdots & \ddots & \vdots \\
		A_{1n} & A_{2n} & \cdots & A_{nn}
	\end{pmatrix}= \begin{pmatrix}
	|A| & 0 & \cdots & 0 \\
	0 & |A| & \cdots & 0 \\
	\vdots & \vdots & \ddots & \vdots \\
	0 & 0 & \cdots & |A|
	\end{pmatrix} = |A| \cdot I_n
	\]
	
	同理可证
	\[
	A^*A = |A| \cdot I_n.
	\]
\end{proof}

\begin{remark}
	在上述定理证明过程中用到了定理\ref{theorem:1.2},即
		\begin{align*}
			a_{r1} A_{s1} + a_{r2} A_{s2} + \cdots + a_{rn} A_{sn} = \delta_{rs}|A|
		\end{align*}
	其中
	\[\delta_{ij} = \begin{cases}
		1,\quad i=j\\
		0,\quad i\neq j
	\end{cases}\]
\end{remark}



\begin{theorem}\label{theorem:2.1}
	若 $|A| \neq 0$,则 $A$ 是一个非奇异矩阵(可逆矩阵),且
	\[
	A^{-1} = \frac{1}{|A|} A^*.
	\]
\end{theorem}

\begin{proof}
	注意到 $|A| \neq 0$,由引理 \ref{lemma:2.1} 可得
	\[
	A \left( \frac{1}{|A|} A^* \right) = \left( \frac{1}{|A|} A^* \right) A = I_n,
	\]
	因此 $A$ 是一个非奇异矩阵,且 $A^{-1} = \frac{1}{|A|} A^*$.
\end{proof}




利用逆矩阵来解线性方程组将显得特别简单.一个线性方程组
\[
\begin{cases}
	a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1, \\
	a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2, \\
	\qquad \vdots \\
	a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n = b_n
\end{cases}
\]
可写成矩阵形式
\[
Ax = \beta,
\]
其中 $A = (a_{ij})$.若 $|A| \neq 0$,则 $A^{-1}$ 必存在,因此
\[
A^{-1}(Ax) = A^{-1}\beta,
\]
即
\[
x = A^{-1}\beta.
\]

将上述中的矩阵写出来就是：
\[
\begin{pmatrix}
	x_1 \\
	x_2 \\
	\vdots \\
	x_n
\end{pmatrix}
=
\frac{1}{|A|}
\begin{pmatrix}
	A_{11} & A_{21} & \cdots & A_{n1} \\
	A_{12} & A_{22} & \cdots & A_{n2} \\
	\vdots & \vdots & \ddots & \vdots \\
	A_{1n} & A_{2n} & \cdots & A_{nn}
\end{pmatrix}
\begin{pmatrix}
	b_1 \\
	b_2 \\
	\vdots \\
	b_n
\end{pmatrix}.
\]

于是
\[
x_j = \frac{1}{|A|} (b_1 A_{1j} + b_2 A_{2j} + \cdots + b_n A_{nj}) = \frac{|A_j|}{|A|},
\]
其中
	\[|A_j|=\begin{vmatrix}
	a_{11} & \cdots &b_1 &\cdots & a_{1n} \\
	a_{21} & \cdots &b_2 &\cdots & a_{2n} \\
	\vdots & \cdots &\vdots &\cdots & \vdots \\
	a_{n1} & \cdots &b_n &\cdots & a_{nn} \\
\end{vmatrix}\]

显然这就是 Cramer 法则.





\begin{theorem}\label{theorem:2.2}
	设$A,B$为$n$阶方阵,则$|AB|= |A||B|$.
\end{theorem}
\begin{proof}
	构造一个$2n$阶方阵,
	\[C = \begin{pmatrix}
		A&O\\
		-I_n&B
	\end{pmatrix}\]
	
	\begin{align*}
		|C| = \begin{vmatrix}
			a_{11} & a_{12} & \cdots & a_{1n} &0 & 0 & \cdots & 0\\
			a_{21} & a_{22} & \cdots & a_{2n} &0 & 0 & \cdots & 0\\
			\vdots & \vdots & \ddots & \vdots &\vdots & \vdots & \ddots & \vdots\\
			a_{n1} & a_{n2} & \cdots & a_{nn}&0 & 0 & \cdots & 0\\
			-1 & 0 & \cdots & 0 &b_{11} & b_{12} & \cdots &b_{1n}\\
			0 & -1 & \cdots & 0 &b_{21} & b_{22} & \cdots & b_{2n}\\
			\vdots & \vdots & \ddots & \vdots &\vdots & \vdots & \ddots & \vdots\\
			0 & 0 & \cdots & -1&b_{n1} & b_{n2}& \cdots & b_{nn}\\
		\end{vmatrix}
	\end{align*}
	
	用$a_{ij}$乘以$|C|$的第$n+j$行加到第$i$行上($1\le i,j\le n$),即将$A$的位置全部消为0,可以得到
	\begin{align*}
		|C| &= \begin{vmatrix}
			0 & 0 & \cdots & 0 &\sum_{r}a_{1r}b_{r1} & \sum_{r}a_{1r}b_{r2} & \cdots & \sum_{r}a_{1r}b_{rn}\\
			0 & 0 & \cdots & 0 &\sum_{r}a_{2r}b_{r1} & \sum_{r}a_{2r}b_{r2} & \cdots & \sum_{r}a_{2r}b_{rn}\\
			\vdots & \vdots & \ddots & \vdots &\vdots & \vdots & \ddots & \vdots\\
			0 & 0 & \cdots & 0&\sum_{r}a_{nr}b_{r1} & \sum_{r}a_{nr}b_{r2} & \cdots & \sum_{r}a_{nr}b_{rn}\\
			-1 & 0 & \cdots & 0 &b_{11} & b_{12} & \cdots &b_{1n}\\
			0 & -1 & \cdots & 0 &b_{21} & b_{22} & \cdots & b_{2n}\\
			\vdots & \vdots & \ddots & \vdots &\vdots & \vdots & \ddots & \vdots\\
			0 & 0 & \cdots & -1&b_{n1} & b_{n2}& \cdots & b_{nn}\\
		\end{vmatrix}\\
		&=\begin{vmatrix}
			O&AB\\
			-I_n&B
		\end{vmatrix}
	\end{align*}
	
	根据Laplace定理可知
	\[|C| = |A||B| \qquad (\text{命题}\ref{proposition:1.14})\]
	同时
	\[|C| = |AB|\cdot (-1)^{1+2+\cdots +n+(n+1)+\cdots +2n}\cdot |-I_n| = (-1)^{n^2+n}|AB| = |AB|\]
	则
	\[|AB|= |A||B|.\]
\end{proof}





\begin{theorem}
	设$A$是$n$阶方阵,则
	\[A\text{可逆} \Longleftrightarrow |A|\neq 0\]
\end{theorem}
\begin{proof}
	(充分性)定理\ref{theorem:2.1}已经证过,下面只证必要性;
	
	设$A$可逆,根据逆矩阵的定义存在$B$使得
	\[AB=BA = I_n\]
	两边同时取行列式可以得到
	\[1 = |I_n| = |AB| = |A||B|\]
	于是可以得到
	\[|A|\neq 0.\]
\end{proof}
\begin{corollary}\label{corollary:2.2}
	设$A$是$n$阶方阵,则
	\[A\text{是奇异矩阵(不可逆矩阵)} \Longleftrightarrow |A|= 0\]
\end{corollary}
\begin{proof}
	上述定理两边同时取反即可得到.
\end{proof}




\begin{proposition}\label{proposition:2.1}
	设$A_1,A_2,\cdots,A_m$为$n$阶方阵,若存在使得$A_i$为奇异阵(不可逆),则
	$A_1A_2\cdots A_m$为奇异阵.
\end{proposition}
\begin{proof}
	由于$A_i$为奇异阵,则$|A_i| = 0$.
	根据定理\ref{theorem:2.2}和推论\ref{corollary:2.2}有
	\[|A_1A_2\cdots A_m| = |A_1||A_2|\cdots|A_m| = 0\]
	故$A_1A_2\cdots A_m$为奇异阵.
\end{proof}



\begin{proposition}
	设$A$可逆,则有
	\[|A^{-1}| = |A|^{-1}.\]
\end{proposition}
\begin{proof}
	$A$可逆,则存在逆矩阵$A^{-1}$使得
	\[I_n = AA^{-1} = A^{-1}A\]
	两边同时取行列式得到
	\[1 = |A||A^{-1}|\]
	\[|A^{-1}| = |A|^{-1}.\]
\end{proof}


\begin{proposition}
	设$A,B$为$n$阶方阵,若$AB = I_n$或$BA=I_n$则\[B=A^{-1}.\]
\end{proposition}
\begin{proof}
	只证$AB=I_n$的情形.
	
	两边同时取行列式得到
	\[1 = |A||B|\]
	于是$|A|\neq 0$,则$A$可逆.
	
	\[B = I_nB = \left(A^{-1}A \right) B = A^{-1}(AB) = A^{-1}I_n = A^{-1}.\]
\end{proof}


\begin{remark}
	通过该命题,无需按照逆矩阵的定义那样验证
	\[AB = BA = I_n,\]
	只要其中一个成立,即为逆矩阵.
\end{remark}



\begin{example}
	计算下列 $n+1$ 阶矩阵 $A$ 的行列式：
	\[
	A = 
	\begin{vmatrix}
		(a_0 + b_0)^n & (a_0 + b_1)^n & \cdots & (a_0 + b_n)^n \\
		(a_1 + b_0)^n & (a_1 + b_1)^n & \cdots & (a_1 + b_n)^n \\
		\vdots & \vdots & \ddots & \vdots \\
		(a_n + b_0)^n & (a_n + b_1)^n & \cdots & (a_n + b_n)^n
	\end{vmatrix}.
	\]
\end{example}
\begin{solution}
	将 $A$ 分解为两个矩阵之积：
	\[
	A = 
	\begin{pmatrix}
		1 & C_n^1 a_0 & C_n^2 a_0^2 & \cdots & C_n^n a_0^n \\
		1 & C_n^1 a_1 & C_n^2 a_1^2 & \cdots & C_n^n a_1^n \\
		\vdots & \vdots & \vdots & \ddots & \vdots \\
		1 & C_n^1 a_n & C_n^2 a_n^2 & \cdots & C_n^n a_n^n
	\end{pmatrix}
	\begin{pmatrix}
		b_0^n & b_1^n & b_2^n & \cdots & b_n^n \\
		b_0^{n-1} & b_1^{n-1} & b_2^{n-1} & \cdots & b_n^{n-1} \\
		\vdots & \vdots & \vdots & \ddots & \vdots \\
		1 & 1 & 1 & \cdots & 1
	\end{pmatrix}.
	\]
	
	上述左边矩阵的行列式每一列提出公因子后就是一个 Vander Monde 行列式.右边矩阵的行列式也可以化为 Vander Monde 行列式并求出其值,于是
	\[
	|A| = C_n^1 C_n^2 \cdots C_n^n \prod_{0 \leq i < j \leq n} (a_j - a_i)(b_i - b_j).
	\]
\end{solution}

\begin{example}
	计算行列式：
	\[
	\begin{vmatrix}
		x & y & -z & w \\
		y & -x & -w & -z \\
		z & -w & x & y \\
		w & z & y & -x
	\end{vmatrix}.
	\]
\end{example}

\begin{solution}
	设该行列式代表的矩阵为 $A$,则
	\[
	AA' = 
	\begin{pmatrix}
		x & y & -z & w \\
		y & -x & -w & -z \\
		z & -w & x & y \\
		w & z & y & -x
	\end{pmatrix}
	\begin{pmatrix}
		x & y & z & w \\
		y & -x & -w & z \\
		-z & -w & x & y \\
		w & -z & y & -x
	\end{pmatrix}
	= 
	\begin{pmatrix}
		u & 0 & 0 & 0 \\
		0 & u & 0 & 0 \\
		0 & 0 & u & 0 \\
		0 & 0 & 0 & u
	\end{pmatrix},
	\]
	其中 $u = x^2 + y^2 + z^2 + w^2$.因此
	\[
	|A|^2 = (x^2 + y^2 + z^2 + w^2)^4.
	\]
	
	令 $x = 1, y = z = w = 0$,显然 $|A| = 1$,故
	\[
	|A| = (x^2 + y^2 + z^2 + w^2)^2.
	\]
\end{solution}






\textbf{行列式与矩阵的性质}
\begin{itemize}
	\item $|A\pm B| \neq |A|\pm |B|$(一般情况下);
	\item $|cA| = c^n |A|$;
	\item $|AB| = |A||B|$;
	\item $|A'| = |A|$;
	\item $|\overline{A}| = \overline{|A|}$;
	\item 若$A$可逆,则$|A^{-1}| = |A|^{-1}$;
	\item 设$n\ge 2$,则 $|A^*| = |A|^{n-1}$.
\end{itemize}
\begin{proof}
	只需证最后一个;
	
	先设$A$为可逆阵,根据定理\ref{theorem:2.1}知有
	\[A^{-1} = \frac{1}{|A|}A^*\]
	从而
	\[A^* = |A|\cdot A^{-1}\]
	取行列式得到
	\[|A^*| = |A|^n |A^{-1}| = |A|^{n-1}\]
	
	再设$A$为奇异阵,即$|A| = 0$,只需证$|A^*| = 0$即可.用反证法,设$|A^*|\neq 0$,则$A^*$为非奇异阵,根据伴随矩阵的性质有
	\[AA^* = |A|I_n = 0\]
	由于$A^*$为非奇异阵,故$A=0$,因此$A^* =0$,矛盾.
\end{proof}



至此,回答了\ref{section:2.1}节最后提出的两个问题(第一个问题:若行列式值不为零,则该方阵可逆).







\section{矩阵的初等变换与初等矩阵}

\begin{example}
	用 Gauss 消去法求解下列线性方程组：
	\[
	\begin{cases}
		x_2 + x_3 = 2, \\
		2x_1 + 3x_2 + 2x_3 = 5, \\
		3x_1 + x_2 - x_3 = -1.
	\end{cases}
	\]
\end{example}
\begin{remark}
	目标:每次变换后与原方程组保持同解;
	最后得到的方程组中,方程$(i)$中只含有$x_i$且系数为1.
\end{remark}

\begin{solution}
	将上述方程组中的第一式与第二式对调得：
	\[
	\begin{cases}
		2x_1 + 3x_2 + 2x_3 = 5, \\
		x_2 + x_3 = 2, \\
		3x_1 + x_2 - x_3 = -1.
	\end{cases}
	\]
	
	将得到的方程组的第一式乘以 $-\frac{3}{2}$ 加到第三式上：
	\[
	\begin{cases}
		2x_1 + 3x_2 + 2x_3 = 5, \\
		x_2 + x_3 = 2, \\
		-\frac{7}{2}x_2 - 4x_3 = -\frac{17}{2}.
	\end{cases}
	\]
	
	将上面的第二式乘以 $\frac{7}{2}$ 加到第三个方程式上：
	\[
	\begin{cases}
		2x_1 + 3x_2 + 2x_3 = 5, \\
		x_2 + x_3 = 2, \\
		-\frac{1}{2}x_3 = -\frac{3}{2}.
	\end{cases}
	\]
	
	将得到的第三式两边乘以 $-2$：
	\[
	\begin{cases}
		2x_1 + 3x_2 + 2x_3 = 5, \\
		x_2 + x_3 = 2, \\
		x_3 = 3.
	\end{cases}
	\]
	
	将上面的最后一式分别乘以 $-1, -2$ 加到第二式及第一式：
	\[
	\begin{cases}
		2x_1 + 3x_2 = -1, \\
		x_2 = -1, \\
		x_3 = 3.
	\end{cases}
	\]
	最后将上面的第二式乘以 $-3$ 加到第一式上,两边再乘以 $\frac{1}{2}$ 就得到方程组的解：
	\[
	\begin{cases}
		x_1 = 1, \\
		x_2 = -1, \\
		x_3 = 3.
	\end{cases}
	\]
\end{solution}


上述求解过程可以用矩阵的变换来代替.将原方程组的系数及常数列排成一个矩阵,称为系数矩阵的增广矩阵,用 $\tilde{A}$ 表示：
\[
\tilde{A} = 
\begin{pmatrix}
	0 & 1 & 1 & 2 \\
	2 & 3 & 2 & 5 \\
	3 & 1 & -1 & -1
\end{pmatrix}.
\]

现在将求解过程用矩阵来描述如下.

将 $\tilde{A}$ 的第一行与第二行对换得：
\[
\begin{pmatrix}
	2 & 3 & 2 & 5 \\
	0 & 1 & 1 & 2 \\
	3 & 1 & -1 & -1
\end{pmatrix}.
\]

将上面矩阵的第一行乘以 $-\frac{3}{2}$ 加到第三行上：
\[
\begin{pmatrix}
	2 & 3 & 2 & 5 \\
	0 & 1 & 1 & 2 \\
	0 & -\frac{7}{2} & -4 & -\frac{17}{2}
\end{pmatrix}.
\]

将第二行乘以 $\frac{7}{2}$ 加到第三行上：
\[
\begin{pmatrix}
	2 & 3 & 2 & 5 \\
	0 & 1 & 1 & 2 \\
	0 & 0 & -\frac{1}{2} & -\frac{3}{2}
\end{pmatrix}.
\]

将第三行乘以 $-2$ 得：
\[
\begin{pmatrix}
	2 & 3 & 2 & 5 \\
	0 & 1 & 1 & 2 \\
	0 & 0 & 1 & 3
\end{pmatrix}.
\]

将第三行乘以 $-1$ 加到第二行上,将第三行乘以 $-2$ 加到第一行上得到：
\[
\begin{pmatrix}
	2 & 3 & 0 & -1 \\
	0 & 1 & 0 & -1 \\
	0 & 0 & 1 & 3
\end{pmatrix}.
\]

将第二行乘以 $-3$ 加到第一行上,最后将第一行乘以 $\frac{1}{2}$：
\[
\begin{pmatrix}
	1 & 0 & 0 & 1 \\
	0 & 1 & 0 & -1 \\
	0 & 0 & 1 & 3
\end{pmatrix}.
\]

从上面的分析可以看出,用 Gauss 消去法解线性方程组的过程可以归结为对矩阵的变换.这不仅简化了解方程组的过程,更重要的是为彻底弄清线性方程组解的理论提供了工具.上面例子适用于求解一般的线性方程组,我们把这种矩阵形式的 Gauss 消去法归结如下：

\begin{enumerate}
	\item 将线性方程组写成标准形式并写出系数矩阵的增广矩阵 $\tilde{A}$.
	\item 将 $\tilde{A}$ 中某一行调到第一行,使第一行第一列的元素不为零.
	\item 将得到的矩阵的第一行乘以某个数加到第二行上,消去第二行第一列的元素.重复这一方法,直到底下第一列除第一行以外的所有元素.
	\item 重复上述步骤,消去第二列第二列的元素不为零并消去第二列上其余元素.不断用这个方法,将系数矩阵变成对角矩阵.
	\item 在每一行乘以适当的数使系数矩阵变为单位阵,从而得出线性方程组的解.
\end{enumerate}

\begin{definition}[矩阵的初等变换]
	下列 3 种矩阵变换分别称为矩阵的第一类、第二类、第三类初等行（列）变换：
	\begin{enumerate}[(1)]
		\item 对调矩阵中某两行（列）的位置；
		\item 用一非零常数乘以矩阵的某一行（列）；
		\item 将矩阵的某一行（列）乘以数 $c$ 后加到另一行（列）上去.
	\end{enumerate}
	
	上述 3 种变换统称为矩阵的初等变换.
\end{definition}


\begin{definition}
	如果一个矩阵 $A$ 经过有限次初等变换后变成 $B$,则称 $A$ 与 $B$ 是等价的,或 $A$ 与 $B$ 相抵,记为 $A \sim B$.
\end{definition}



用初等变换可以将一个矩阵化简到什么程度？下面的定理回答了这个问题.

\begin{theorem}\label{theorem:2.4}
	任一 $m \times n$ 矩阵 $A = (a_{ij})_{m \times n}$ 必相抵于下列 $m \times n$ 矩阵：
	\[
	B = \begin{pmatrix}
		1 & \cdots & 0 & \cdots & 0 \\
		\vdots & \ddots & \vdots & \ddots & \vdots \\
		0 & \cdots & 1 & 0 & 0 \\
		0 & \cdots & 0 & 0 & 0 \\
		\vdots & \ddots & \vdots & \ddots & \vdots \\
		0 & \cdots & 0 & 0 & 0
	\end{pmatrix} = \begin{pmatrix}
		I_r & O \\
		O & O
	\end{pmatrix}
	\]
	其中 $B$ 的前 $r$ 行及前 $r$ 列交点处有 $r$ 个 1,其余元素皆为零.换言之,任一 $m \times n$ 矩阵均与一个主对角线上元素等于 1 或 0 而其余元素均为 0 的 $m \times n$ 矩阵相抵.
\end{theorem}



\begin{proof}
	对$\min \{ m,n\}$进行归纳,若$\min \{ m,n\} = 0$,则称归纳结束.设$\min \{ m,n\}<k$结论成立,即证$\min \{ m,n\} = k$的情形.
	
	若 $A = 0$,则结论显然成立.现设 $A \neq 0$,即 $A$ 至少有一个元素 $a_{ij} \neq 0$.如果 $a_{ij}$ 不在第 $(1,1)$ 位置,那么可将它所在的行与第一行对换,再将它所在的列与第一列对换就可将 $a_{ij}$ 调至第 $(1,1)$ 位置.所以我们不妨设 $a_{11} \neq 0$.接下去将第一行依次乘以 $-a_{11}^{-1} a_{i1}$ 加到第 $i$ 行上去 $(i = 2,3,\ldots,m)$,于是第一列元素除 $a_{11}$ 外都变成了零.再将第一列元素乘以 $-a_{11}^{-1} a_{1j}$ 后加到第 $j$ 列上去 $(j = 2,3,\ldots,n)$,则第一行元素除了 $a_{11}$ 外都变成零.再用 $a_{11}^{-1}$ 乘以第一行,就得到第 $(1,1)$ 元素等于 1,而第一行及第一列其他元素都是零的矩阵,其形状如下：
	\[
	\begin{pmatrix}
		1 & 0 & \cdots & 0 \\
		0 & b_{22} & \cdots & b_{2n} \\
		\vdots & \vdots & \ddots & \vdots \\
		0 & b_{m2} & \cdots & b_{mn}
	\end{pmatrix}.
	\]
	
	记右下角矩阵为$B$,显然$B$的阶数为$(m-1)\times (n-1)$,$\min\{ m-1,n-1\} = \min\{m,n\} - 1 = k-1$,由归纳假设,$B$一定可通过初等变换变为
	\[\begin{pmatrix}
		I_{r-1}&O\\
		O&O
	\end{pmatrix}\]
	于是
	\[A\sim \begin{pmatrix}
		I_r&O\\
		O&O
	\end{pmatrix}\]
\end{proof}

 
\begin{remark}
	其中$0\le r\le \min\{ m,n\}\}$,并且$r$不依赖于初等变换的选取,$r$由$A$唯一确定(在第三章中证明(推论\ref{corollary:3.6})).矩阵$B$称为矩阵$A$的相抵标准型.
\end{remark}







我们在进行初等变换的过程中,通常需要同时用行变换和列变换,如果将初等变换仅限制为行变换,上述定理还成立吗？

考虑下面的 $1 \times 3$ 矩阵：
\[
(0, 1, 2).
\]

显然,我们仅用初等行变换无论如何也不能将它化为标准型！但是我们可以用初等行变换将矩阵化为所谓的阶梯形（上阶梯形）.


\begin{definition}
	设 $A = (a_{ij})_{m \times n}$ 为 $m \times n$ 矩阵.对任意的 $1 \leq i \leq m$,定义 $k_i$ 如下：若 $A$ 的第 $i$ 行元素全为零,则 $k_i = +\infty$；若 $A$ 的第 $i$ 行元素不全为零,则 $k_i$ 是第 $i$ 行所有非零元素列指标的最小值.即若 $k_i < +\infty$,则 $a_{ik_i}$ 是 $A$ 的第 $i$ 行中从左至右第一个非零的元素,$a_{ik_i}$ 称为第 $i$ 行的阶梯点.
	
	若存在 $0 \leq r \leq m$,使得 $k_1 < k_2 < \cdots < k_r, k_{r+1} = \cdots = k_m = +\infty$,则称这种样的矩阵 $A$ 为阶梯形矩阵.简单地说,若矩阵阶梯点的列指标随着行数严格递增,或者从图形上看非零元素全体构成一个阶梯,我们就称之为阶梯形矩阵.
\end{definition}
\begin{note}
	阶梯型矩阵中,阶梯点的列指标随着行指标严格递增.
\end{note}


\begin{theorem}
	设 $A$ 是一个 $m \times n$ 矩阵,则经过若干次初等行变换,$A$ 可以化为阶梯形矩阵.
\end{theorem}
\begin{proof}
	对列数$n$进行归纳,当$n=0$时表示归纳结束.设当列数$<n$时结论成立,下证当列数$=n$的情形.
	
	若$A$的第一列全为0,则$A$可以写为
	\[A = \begin{pmatrix}
		\begin{array}{c:c}
			O &A_1
		\end{array}
	\end{pmatrix}\]
	显然$A_1$是$m\times (n-1)$阶矩阵,由归纳假设知$A_1$可以通过初等行变换化为阶梯型矩阵$B_1$,故$A$可以化为阶梯型矩阵
	\[\begin{pmatrix}
		\begin{array}{c:c}
			O &B_1
		\end{array}
	\end{pmatrix}\]
	
	若$A$的第一列不全为零,可以通过行对换将非零元换到(1,1)位置.故不妨设$a_{11}\neq 0$.将第一行乘以$-a_{i1}(i\ge 2)$加到第$i$行上,可以将第一列$a_{11}$下面的元素全消为0.此时矩阵为
	\[\begin{pmatrix}
		a_{11}&a_{12}&\cdots &a_{1n}\\
		0&b_{11}&\cdots &b_{1,n-1}\\
		\vdots &\vdots&\cdots &\vdots\\
		0&b_{n-1,1}&\cdots &b_{n-1,n-1}\\
	\end{pmatrix}\]
	此时右下角的$n-1$阶矩阵记为$B$,由归纳假设$B$可以通过初等行变换化为阶梯型矩阵,故$A$可以通过初等行变换化为阶梯型矩阵.
\end{proof}



矩阵的初等变换能否通过矩阵的运算来实现？为此我们引进初等矩阵的概念.

\begin{definition}[初等矩阵]
	对单位矩阵 $I_n$ 施以第一类、第二类、第三类初等变换后得到的矩阵分别称为第一类、第二类及第三类初等矩阵.
\end{definition}

3 类初等矩阵的形状如下.

\textbf{第一类初等矩阵} \quad 第一类初等矩阵 $P_{ij}$ 表示将单位矩阵的第 $i$ 行与第 $j$ 行（第 $i$ 列与第 $j$ 列）对换后得到的矩阵：
\[
P_{ij} = 
\begin{pmatrix}
	1 & & & \\
	& \ddots & & \\
	& & 0 & \cdots & 1 & \\
	& & \vdots & & \vdots & \\
	& & 1 & \cdots & 0 & \\
	& & & & & \ddots & \\
	& & & & & & 1
\end{pmatrix}
\]



\textbf{第二类初等矩阵} \quad 第二类初等矩阵 $P_i(c)$ 表示将常数 $c (c \neq 0)$ 乘以单位矩阵的第 $i$ 行（第 $i$ 列）而得到的矩阵：
\[
P_i(c) = 
\begin{pmatrix}
	1 & & & \\
	& \ddots & & \\
	& & c & \\
	& & & \ddots & \\
	& & & & 1
\end{pmatrix}
\]

\textbf{第三类初等矩阵}\quad 第三类初等矩阵 $T_{ij}(c)$ 表示将单位矩阵的第 $i$ 行（第 $j$ 列）乘以 $c$ 后加到第 $j$ 行（第 $i$ 列）上得到的矩阵：
\[
T_{ij}(c) = 
\begin{pmatrix}
	1 & & & \\
	& \ddots & & \\
	& & 1 & \cdots  & 0\\
	& & \vdots & & \vdots & \\
	& & c & \cdots & 1 & \\
	& & & & & \ddots & \\
	& & & & & & 1
\end{pmatrix}
\]

下面的定理揭示了初等变换与初等矩阵的密切联系.

\begin{theorem}\label{theorem:2.6}
	 设 $A$ 是一个 $m \times n$ 矩阵,则对 $A$ 作一次初等行变换后得到的矩阵等于用一个 $m$ 阶相应的初等矩阵（即第一类初等变换相应于第一类初等矩阵,第二类初等变换相应于第二类初等矩阵,等等）左乘 $A$ 后得到的积.矩阵 $A$ 作一次初等列变换后得到的矩阵等于用一个 $n$ 阶相应的初等矩阵右乘 $A$ 后所得到的积.
\end{theorem}
\begin{proof}
	按照矩阵乘法展开即可得到.
\end{proof}





\begin{lemma}
	\begin{itemize}
		\item 初等矩阵都是非奇阵且其逆矩仍是同类初等矩阵：
		\[
		P_{ij}^{-1} = P_{ij}, \quad P_i(c)^{-1} = P_i\left(\frac{1}{c}\right), \quad T_{ij}(c)^{-1} = T_{ij}(-c).
		\]
		\item 三类初等矩阵的行列式如下：
		\[
		|P_{ij}| = -1, \quad |P_i(c)| = c, \quad |T_{ij}(c)| = 1.
		\]
		\item 非奇阵经初等变换后仍是非奇阵,奇异阵经初等变换后仍是奇异阵.
	\end{itemize}
\end{lemma}
\begin{proof}
	\begin{itemize}
		\item 根据上述定理并结合逆矩阵的定义即可得到;
		\item 因为单位阵的行列式等于1,故交换单位阵两行而得到的矩阵 $P_{ij}$的行列式等于－1．其余结论显然.
		\item 根据上述定理,$A$的初等变换等价于左乘或右乘初等阵,即为
		\[B = P_r\cdots P_2P_1 A Q_1 Q_2\cdots Q_s\]
		其中$P_i,Q_j$都是初等阵,根据第一条性质,$P_i,Q_j$都是非奇异阵.则有
		\[A\text{为非奇异阵}\longrightarrow B\text{为非奇异阵}\footnote{\hyperref[可逆矩阵的乘积]{\textcolor{blue}{可逆矩阵的乘积仍然是可逆阵.}}
		}\]
		\[A\text{为奇异阵}\longrightarrow B\text{为奇异阵}\footnote{\hyperref[proposition:2.1]{\textcolor{blue}{矩阵的乘积中只要有一个是奇异阵,则结果为奇异阵.}}}\]
	\end{itemize}
\end{proof}



下面证明矩阵的相抵关系是等价关系.

\begin{theorem}
	矩阵的相抵关系适合下列性质：
	\begin{enumerate}[(1)]
		\item 自反性:$A \sim A$;
		\item 对称性:若 $A \sim B$, 则 $B \sim A$;
		\item 传递性:若 $A \sim B, B \sim C$, 则 $A \sim C$.
	\end{enumerate}
\end{theorem}
\begin{proof}
	\begin{enumerate}[(1)]
		\item 显然单位阵 $I$ 也是初等矩阵,而 $IA = A$ 表明 $A \sim A$.
		\item 由 $A \sim B$ 知存在初等矩阵 $P_1, \cdots , P_m$ 以及初等矩阵 $Q_1, \cdots , Q_s$,使
		\[
		P_m \cdots P_1 A Q_1 \cdots Q_s = B.
		\]
		于是
		\[
		P_1^{-1} \cdots P_m^{-1} B Q_s^{-1} \cdots Q_1^{-1} = A.
		\]
		但是初等矩阵的逆矩仍是初等矩阵,因此 $B \sim A$.
		\item 由 $A \sim B, B \sim C$,可设
		\[
		B = P_m \cdots P_1 A Q_1 \cdots Q_k, \quad C = S_s \cdots S_1 B T_1 \cdots T_t,
		\]
		其中 $P_i, Q_i, S_i, T_i$ 都是初等矩阵.于是
		\[
		C = S_s \cdots S_1 P_m \cdots P_1 A Q_1 \cdots Q_k T_1 \cdots T_t.
		\]
		因此 $A \sim C$.
	\end{enumerate}
\end{proof}


\begin{theorem}\label{theorem:2.8}
	设$A$为$n$阶方阵,则下列结论等价:
	\begin{enumerate}[(1)]
		\item $A$为非奇异阵;
		\item $A$的相抵标准型为$I_n$;
		\item $A$只通过初等行变换或初等列变换就能变为$I_n$;
		\item $A$是若干个初等矩阵的乘积.
	\end{enumerate}
\end{theorem}
\begin{proof}
	(1)$\Longrightarrow$ (2) 设$A\sim \begin{pmatrix}
	I_r&O\\
	O&O
	\end{pmatrix}$,其中$1\le r\le n$.$A$为非奇异阵,由于初等变换不改变奇异性,故$\begin{pmatrix}
	I_r&O\\
	O&O
	\end{pmatrix} $也为奇异阵.则$r = n$,即$A\sim I_n$.
	
	(2)$\Longrightarrow$ (3) 设$A\sim I_n$,则存在初等矩阵 $P_1, \cdots , P_m$ 以及初等矩阵 $Q_1, \cdots , Q_s$,使得
	\[
	P_m \cdots P_1 A Q_1 \cdots Q_s = I_n,
	\]
	根据逆矩阵的定义有 \[Q_1 \cdots Q_sP_m \cdots P_1 A  = I_n,\]
	于是$A$只通过初等行变换就能变为$I_n$;对于初等列变换也是同理.
	
	(3)$\Longrightarrow$ (4) 设$A$只通过初等行变换就能变为$I_n$,则存在初等矩阵 $P_1, \cdots , P_m$ 使得
	\[P_m \cdots P_1 A  = I_n,\]
	同样根据逆矩阵的定义有
	\[A = (P_m \cdots P_1)^{-1} = P_1^{-1}P_2^{-1}\cdots P_m^{-1}\]
	由于初等矩阵的逆矩阵仍是初等矩阵,故$A$是若干个初等矩阵的乘积.
	
	(4)$\Longrightarrow$ (1) 设$A$是若干个初等矩阵的乘积,则存在 $ P_1, \cdots , P_m$使得
	\[P_1 \cdots  P_m = A \]
	由于每个$P_i$都是非奇异阵,故$A$是非奇异阵.
\end{proof}




有了上述定理后,可以对定理\ref{theorem:2.4}进行改写得到如下推论.

\begin{corollary}
	设$A = (a_{ij})_{m\times n}$,则存在$m$阶非奇异阵$P$和$n$阶非奇异阵$Q$使得
	\[PAQ = \begin{pmatrix}
		I_r &O\\
		O&O\\
	\end{pmatrix}\]
	其中$1\le r\le \min\{ m,n\}$.
\end{corollary}
\begin{proof}
	根据定理\ref{theorem:2.4}可知任一$m\times n$阶矩阵都能通过若干次初等行变换或初等列变换相抵于
	\[\begin{pmatrix}
	I_r &O\\
	O&O\\
\end{pmatrix}\]
根据定理\ref{theorem:2.6}(初等行变换等价于左乘初等矩阵,初等列变换等价于右乘初等矩阵)可知,存在$m$阶初等矩阵 $P_1, \cdots , P_r$ 以及$n$阶初等矩阵 $Q_1, \cdots , Q_s$,使得
\[
P_r \cdots P_1 A Q_1 \cdots Q_s \sim \begin{pmatrix}
	I_r &O\\
	O&O\\
\end{pmatrix} ,
\]
由于每一个$P_i,Q_j$都是非奇异阵,故乘积也是非奇异阵.令
\[P =P_r \cdots P_1,\quad Q = Q_1 \cdots Q_s \]
则存在$m$阶非奇异阵$P$和$n$阶非奇异阵$Q$使得
\[PAQ = \begin{pmatrix}
	I_r &O\\
	O&O\\
\end{pmatrix}\]
\end{proof}




根据定理\ref{theorem:2.8}的(1)(3)两条结论我们有如下结论.

设$A$是非奇异阵,则存在初等矩阵$P_i$,使得
\[P_r\cdots P_2P_1 A = I_n\]
根据逆矩阵的定义有
\[A^{-1} = P_r\cdots P_2P_1\]
于是就有了下面求逆矩阵的方法.

\begin{proposition}
	设$A$是$n$阶非奇异阵,构造一个$n\times 2n$阶矩阵
	\[\begin{pmatrix}
		\begin{array}{c:c}
			A& I_n
		\end{array}
	\end{pmatrix}\]
	对其进行初等行变换,将左边化为$I_n$,此时对应的右边矩阵即为$A^{-1}$.
\end{proposition}
\begin{proof}
	由上述结论知不断对该矩阵左乘初等矩阵$P_i$,得到
	\[\begin{pmatrix}
		P_r\cdots P_2P_1 A& P_r\cdots P_2P_1 I_n
	\end{pmatrix}\]
	当左边变为$I_n$时,对应右边的矩阵即为$A^{-1}$.
\end{proof}

\begin{note}
	同理,可以对下面$2n\times n$阶矩阵
	\[\begin{pmatrix}
		\begin{array}{c}
			A\\
			\hdashline
			I_n
		\end{array}
	\end{pmatrix}\]
	进行初等列变换,将上面化为$I_n$,此时对应的下方矩阵即为$A^{-1}$.
\end{note}



上述命题为求解矩阵方程提供了一个好的方法.

设有$n$阶方阵$A$,$n\times m$阶矩阵$X$以及$n\times m$阶矩阵$B$满足
\[AX = B\]
则可以对下面$n\times (n+m)$阶矩阵进行初等行变换
\[\begin{pmatrix}
	\begin{array}{c:c}
		A & B
	\end{array}
\end{pmatrix}\]
当左侧化为$I_n$时,右侧即为$A^{-1}B$.

同理,若有
\[XA = B\]
$A$为$n$阶方阵,$X$为$m\times n$阶矩阵,$B$为$m\times n$阶矩阵,则可以对下面$(n+m)\times n$阶矩阵进行初等列变换求解
\[\begin{pmatrix}
	\begin{array}{c}
		A\\
		\hdashline
		B
	\end{array}
\end{pmatrix}\]
当上面化为$I_n$时,下面即为$BA^{-1}$.





\section{分块矩阵}

矩阵运算是一种比较复杂的运算.为了简化这种运算,我们引进分块矩阵及其运算的概念.读者务必注意,分块矩阵及其运算不是新的运算,而是矩阵运算的简化形式.

什么叫矩阵的分块？简单地说就是用横虚线与竖虚线将一个矩阵分成若干块,这样得到的矩阵就称为“分块矩阵”.例如：

\[
A = \left(\begin{array}{ccc:c}
	1 & 2 & -1 & 0 \\
	2 & 5 & 0 & -2 \\
	\hdashline
	3 & 1 & -1 & 3 \\
\end{array}\right)
\]

是一个分块矩阵,若记

\[
A_{11} = \begin{pmatrix}
	1 & 2 & -1 \\
	2 & 5 & 0
\end{pmatrix}, \quad A_{12} = \begin{pmatrix}
	0 \\
	-2
\end{pmatrix},
\]

\[
A_{21} = (3, 1, -1), \quad A_{22} = (3),
\]

则 $A$ 可表示为

\[
A = \begin{pmatrix}
	A_{11} & A_{12} \\
	A_{21} & A_{22}
\end{pmatrix},
\]

这是一个分了 4 块的矩阵.




\begin{definition}[分块矩阵]
	对 $m \times n$ 矩阵 $A$,若先用若干条横虚线把它分成 $r$ 块,再用若干条竖虚线把它分成 $s$ 块,我们就得到了一个 $rs$ 块分块矩阵,可记为
	
	\[
	A = \begin{pmatrix}
		A_{11} & A_{12} & \cdots & A_{1s} \\
		A_{21} & A_{22} & \cdots & A_{2s} \\
		\vdots & \vdots & \ddots & \vdots \\
		A_{r1} & A_{r2} & \cdots & A_{rs}
	\end{pmatrix}.
	\]
	
	注意,这里 $A_{ij}$ 代表一个矩阵,$A_{ij}$ 常称为 $A$ 的第 $(i,j)$ 块.$A$ 也可记为 $(A_{ij})$,但需注明这是分块矩阵.
\end{definition}








一个矩阵可以有各种各样的分块方法,究竟怎么分比较好,要看具体需要而定.例如：

\[
A = \left(\begin{array}{cc:cc:c}
	1 & 1 & 0 & 0 & 0 \\
	-1 & 1 & 0 & 0 & 0 \\
	\hdashline
	0 & 0 & 1 & 0 & 0 \\
	0 & 0 & 1 & 1 & 0 \\
	\hdashline
	0 & 0 & 0 & 0 & 1 \\
\end{array}\right),
\]

记

\[
A_1 = \begin{pmatrix}
	1 & 1 \\
	-1 & 1
\end{pmatrix}, \quad A_2 = \begin{pmatrix}
	1 & 0 \\
	1 & 1
\end{pmatrix}, \quad A_3 = (1),
\]

则

\[
A = \begin{pmatrix}
	A_1 & O & O \\
	O & A_2 & O \\
	O & O & A_3
\end{pmatrix}.
\]

$A$ 作为分块矩阵看,是一个对角阵.这种矩阵称为分块对角阵,尽管它本身并不是对角阵.需要注意的是 $A$ 中的 $O$ 都表示零矩阵.

两个分块矩阵 $A = (A_{ij})_{r \times s}$ 及 $B = (B_{ij})_{k \times l}$ 称为相等,若 $r = l, s = k$,且 $A_{ij} = B_{ij}$, $(i = 1, 2, \cdots, r; j = 1, 2, \cdots, s)$.因此两个分块矩阵相等,不仅它们的分块方式相同,而且每一块也相等.显然,这时 $A$ 与 $B$ 作为普通矩阵也相等.

下面我们依次来研究分块矩阵的运算.


\begin{definition}[分块矩阵的加法]
	设有 $m \times n$ 矩阵 $A$ 及 $B$,它们具有相同的分块,即
	
	\[
	A = (A_{ij})_{r \times s}, \quad B = (B_{ij})_{r \times s};
	\]
	
	且 $A_{ij}$ 与 $B_{ij}$ 作为矩阵其行数与列数分别相等,则
	
	\[
	A + B = (A_{ij} + B_{ij}), \quad A - B = (A_{ij} - B_{ij}).
	\]
	
	显然,两个分块矩阵之和（或差）仍是一个分块矩阵,且这个和（或差）与 $A, B$ 作为普通矩阵之和（或差）是一致的.
\end{definition}

\begin{definition}[分块矩阵的数乘]
	分块矩阵 $A = (A_{ij})_{r \times s}$ 与常数 $c$ 的数乘为
	
	\[
	cA = (cA_{ij})_{r \times s}.
	\]
\end{definition}




\begin{definition}[分块矩阵的乘法]
	分块矩阵的乘法与普通矩阵的乘法在形式上类似,只是在处理块与块之间的乘法时必须保证符合矩阵相乘的条件.因此,对分块的情况要特别予以注意.设 $A = (A_{ij})_{r \times s}$,$B = (B_{ij})_{s \times t}$ 是两个分块矩阵（注意：$A$ 的列分成 $s$ 块而 $B$ 的行也分成 $s$ 块）.又设
	
	\[
	A = \begin{pmatrix}
		A_{11} & A_{12} & \cdots & A_{1s} \\
		A_{21} & A_{22} & \cdots & A_{2s} \\
		\vdots & \vdots & \ddots & \vdots \\
		A_{r1} & A_{r2} & \cdots & A_{rs}
	\end{pmatrix}, \quad
	B = \begin{pmatrix}
		B_{11} & B_{12} & \cdots & B_{1t} \\
		B_{21} & B_{22} & \cdots & B_{2t} \\
		\vdots & \vdots & \ddots & \vdots \\
		B_{s1} & B_{s2} & \cdots & B_{st}
	\end{pmatrix}.
	\]
	
	上述分块矩阵适合如下条件：在 $A$ 中,第 $(1,1)$ 块 $A_{11}$ 的行数为 $m_1$,列数为 $n_1$,第 $(1,2)$ 块 $A_{12}$ 的行数为 $m_1$,列数为 $n_2$,⋯,第 $(i,j)$ 块 $A_{ij}$ 的行数为 $m_i$,列数为 $n_j$.$B$ 中第 $(i,j)$ 块 $B_{ij}$ 的行数为 $n_i$,列数为 $l_j$.这样的分块方式保证了分块相乘有意义.若记分块矩阵 $A$ 与 $B$ 的积为
	
	\[
	C = \begin{pmatrix}
		C_{11} & C_{12} & \cdots & C_{1t} \\
		C_{21} & C_{22} & \cdots & C_{2t} \\
		\vdots & \vdots & \ddots & \vdots \\
		C_{r1} & C_{r2} & \cdots & C_{rt}
	\end{pmatrix},
	\]
	
	则 $C_{ij}$ 是一个 $m_i \times l_j$ 矩阵,且
	
	\[
	C_{ij} = A_{i1} B_{1j} + A_{i2} B_{2j} + \cdots + A_{is} B_{sj}.
	\]
\end{definition}






\begin{example}
	\begin{equation*}
		A=\left( \begin{array}{cc:c:cc}
			1 & 0 & 2 & -1 & 0 \\
			0 & 1 & 1 & -2 & 1 \\
			\hdashline
			0 & 0 & 3 & 1 & 0 \\
			1 & 0 & -2 & 0 & 1
		\end{array}\right)\qquad
		B=
		\left(\begin{array}{cc:c}
			1 & 0 & 2 \\
			0 & 1 & 0 \\
			\hdashline
			-1 & 1 & 3 \\
			\hdashline
			0 & 1 & -1 \\
			2 & 0 & 1
		\end{array}\right),
	\end{equation*}
	求$AB$.
\end{example}
\begin{solution}
	将 $A, B$ 写成下列分块形状：
	
	\[
	A = \begin{pmatrix}
		A_{11} & A_{12} & A_{13} \\
		A_{21} & A_{22} & A_{23}
	\end{pmatrix}, \quad
	B = \begin{pmatrix}
		B_{11} & B_{12} \\
		B_{21} & B_{22} \\
		B_{31} & B_{32}
	\end{pmatrix},
	\]
	
	其中 $A_{ij}, B_{ij}$ 是 $A, B$ 中相应的块.容易看出这两个分块矩阵符合相乘的条件.设 $C = AB$,则 $C$ 也是分块矩阵.因为 $A$ 是 $2 \times 3$ 分块,$B$ 是 $3 \times 2$ 分块,故 $C$ 是 $2 \times 2$ 分块.不难看出
	
	\[
	C_{11} = A_{11} B_{11} + A_{12} B_{21} + A_{13} B_{31}.
	\]
	
	将各块代入,得到
	
	\[
	C_{11} = \begin{pmatrix}
		1 & 0 \\
		0 & 1
	\end{pmatrix} \begin{pmatrix}
		1 & 0 \\
		0 & 1
	\end{pmatrix} + \begin{pmatrix}
		2 \\
		1
	\end{pmatrix} (-1,1) + \begin{pmatrix}
		-1 & 0 \\
		-2 & 1
	\end{pmatrix} \begin{pmatrix}
		0 & 1 \\
		2 & 0
	\end{pmatrix}
	= \begin{pmatrix}
		1 & 0 \\
		0 & 1
	\end{pmatrix} + \begin{pmatrix}
		-2 & 2 \\
		-1 & 1
	\end{pmatrix} + \begin{pmatrix}
		0 & -1 \\
		2 & -2
	\end{pmatrix} = \begin{pmatrix}
		-1 & 1 \\
		1 & 0
	\end{pmatrix}.
	\]
	
	同理
	
	\[
	C_{12} = A_{11} B_{12} + A_{12} B_{22} + A_{13} B_{32} = \begin{pmatrix}
		9 \\
		6
	\end{pmatrix},
	\]
	
	\[
	C_{21} = A_{21} B_{11} + A_{22} B_{21} + A_{23} B_{31} = \begin{pmatrix}
		-3 & 4 \\
		5 & -2
	\end{pmatrix},
	\]
	
	\[
	C_{22} = A_{21} B_{12} + A_{22} B_{22} + A_{23} B_{32} = \begin{pmatrix}
		8 \\
		-3
	\end{pmatrix}.
	\]
	
	于是
	\[
	\begin{pmatrix}
		\begin{array}{cc:c}
			-1 & 1 & 9 \\
			1 & 0 & 6 \\
			\hdashline
			-3 & 4 & 8 \\
			5 & -2 & -3
		\end{array}
	\end{pmatrix}\]
\end{solution}



\begin{problem}
	验证:分块矩阵的乘法所得的结果与作为普通矩阵的乘法所得的结果是一致的.
\end{problem}






\begin{definition}[分块矩阵的转置]
	设有分块矩阵 $A = (A_{ij})_{r \times s}$,则 $A$ 的转置为 $s \times r$ 分块矩阵：
	
	\[
	A' = \begin{pmatrix}
		A'_{11} & A'_{21} & \cdots & A'_{r1} \\
		A'_{12} & A'_{22} & \cdots & A'_{r2} \\
		\vdots & \vdots & \ddots & \vdots \\
		A'_{1s} & A'_{2s} & \cdots & A'_{rs}
	\end{pmatrix}.
	\]
	
\end{definition}


\begin{definition}[分块矩阵的共轭]
	设 $A$ 是一个分块复矩阵,$A = (A_{ij})_{r \times s}$,则 $A$ 的共轭矩阵也是一个 $r \times s$ 分块矩阵,且
	
	\[
	\overline{A} = \begin{pmatrix}
		\overline{A_{11}} & \overline{A_{12}} & \cdots & \overline{A_{1s}} \\
		\overline{A_{21}} & \overline{A_{22}} & \cdots & \overline{A_{2s}} \\
		\vdots & \vdots & \ddots & \vdots \\
		\overline{A_{r1}} & \overline{A_{r2}} & \cdots & \overline{A_{rs}}
	\end{pmatrix}.
	\]
\end{definition}




读者也许感到,上述例子似乎比不分块更麻烦.现在来看几个例子,它们表明了分块运算的优越性.


\begin{example}
	有两个分块对角阵：
	
	\[
	A = \begin{pmatrix}
		A_1 & O & \cdots & O \\
		O & A_2 & \cdots & O \\
		\vdots & \vdots & \ddots & \vdots \\
		O & O & \cdots & A_k
	\end{pmatrix}, \quad
	B = \begin{pmatrix}
		B_1 & O & \cdots & O \\
		O & B_2 & \cdots & O \\
		\vdots & \vdots & \ddots & \vdots \\
		O & O & \cdots & B_k
	\end{pmatrix},
	\]
	
	其中 $A_i$ 与 $B_i$ 都是同阶方阵,因此 $A$ 与 $B$ 可按分块矩阵相乘,
	
	\[
	AB = \begin{pmatrix}
		A_1 B_1 & O & \cdots & O \\
		O & A_2 B_2 & \cdots & O \\
		\vdots & \vdots & \ddots & \vdots \\
		O & O & \cdots & A_k B_k
	\end{pmatrix}.
	\]
\end{example}


这个例子表明,分块对角矩阵相乘时只需将主对角线上的块相乘即可.

\begin{example}
	$A$ 是一个分块对角阵：
	
	\[
	A = \begin{pmatrix}
		A_1 & O & \cdots & O \\
		O & A_2 & \cdots & O \\
		\vdots & \vdots & \ddots & \vdots \\
		O & O & \cdots & A_k
	\end{pmatrix},
	\]
	
	其中每块 $A_i$ 都是非异阵,求证：$A$ 也是非异阵.
\end{example}
\begin{proof}
	设 $A_i$ 之逆为 $A_i^{-1}$,则显然
	
	\[
	A^{-1} = \begin{pmatrix}
		A_1^{-1} & O & \cdots & O \\
		O & A_2^{-1} & \cdots & O \\
		\vdots & \vdots & \ddots & \vdots \\
		O & O & \cdots & A_k^{-1}
	\end{pmatrix}. 
	\]
\end{proof}



设 $A$ 是一个 $m \times n$ 矩阵,$B$ 是一个 $n \times r$ 矩阵,可对 $B$ 作列分块,即将 $B$ 的每个列向量分作一块,记为 $\beta_j \ (j = 1, 2, \cdots, r)$,则

\[
B = (\beta_1, \beta_2, \cdots, \beta_r).
\]

又将 $A$ 看成分为只成一块的矩阵,则 $AB$ 可按分块矩阵相乘,且 $AB$ 的列分块为

\[
AB = (A\beta_1, A\beta_2, \cdots, A\beta_r).
\]

同样,可对 $A$ 作行分块,即将 $A$ 的每个行向量分作一块,记为 $\alpha_i \ (i = 1, 2, \cdots, m)$,则

\[
A = \begin{pmatrix}
	\alpha_1 \\
	\alpha_2 \\
	\vdots \\
	\alpha_m
\end{pmatrix}.
\]

又将 $B$ 看成是只有一块的矩阵,则 $AB$ 可按分块矩阵相乘,且 $AB$ 的行分块为

\[
AB = \begin{pmatrix}
	\alpha_1 B \\
	\alpha_2 B \\
	\vdots \\
	\alpha_m B
\end{pmatrix}.
\]


对分块矩阵而言,我们也有分块初等变换和分块初等矩阵的概念.它们是处理分块矩阵问题的有用工具.

所谓分块初等变换和普通的初等变换类似,包含 3 类：

第一类：对调分块矩阵的两块行或两块列；

第二类：以某个可逆矩阵左乘以分块矩阵的某块行(行变换),或右乘以某块列(列变换)；

第三类：以某个矩阵左乘以分块矩阵的某块行后加到另一块行上去,或以某个矩阵右乘以分块矩阵的某块列后加到另一块列上去.

我们假定上面所提到的运算都是可以进行的.


和普通矩阵一样,我们也有分块初等矩阵的概念,它和分块初等变换的关系与普通矩阵类似.

记 $I = \operatorname{diag}\{I_{m_1}, I_{m_2}, \cdots, I_{m_k}\}$ 是分块单位阵,定义下列 3 种矩阵为 3 类分块初等矩阵：

\begin{enumerate}[(1)]
	\item 对调 $I$ 的第 $i$ 块行（列）与第 $j$ 块行（列）得到的矩阵；
	\item 以可逆矩阵 $C$ 左（右）乘以 $I$ 的第 $i$ 块行（列）得到的矩阵；
	\item 以矩阵 $B$ 左（右）乘以 $I$ 的第 $i$ 块行（列）后加到第 $j$ 块行（列）上后得到的矩阵.
\end{enumerate}

\textbf{第一类分块初等矩阵}\quad 对调 $I$ 的第 $i$ 块行与第 $j$ 块行得到的矩阵；

\[
P_{ij} = 
\begin{pmatrix}
	I_{m_1} & & & \\
	& \ddots & & \\
	& & O & \cdots & I_{m_j} & \\
	& & \vdots & & \vdots & \\
	& & I_{m_i} & \cdots & O & \\
	& & & & & \ddots & \\
	& & & & & & I_{m_k}
\end{pmatrix}
\]



\textbf{第二类分块初等矩阵}\quad 以可逆矩阵 $M$ ($m_i$阶)左乘以 $I$ 的第 $i$ 块行得到的矩阵；
\[
P_i(M) = 
\begin{pmatrix}
	I_{m_1} & & & \\
	& \ddots & & \\
	& & M & \\
	& & & \ddots & \\
	& & & & I_{m_k}
\end{pmatrix}
\]


\textbf{第三类分块初等矩阵}\quad 以矩阵 $M$ 左乘以 $I$ 的第 $i$ 块行后加到第 $j$ 块行上后得到的矩阵.
\[
T_{ij}(M) = 
\begin{pmatrix}
	I_{m_1} & & & \\
	& \ddots & & \\
	& & I_{m_i} & \cdots  & O\\
	& & \vdots & & \vdots & \\
	& & M & \cdots & I_{m_j} & \\
	& & & & & \ddots & \\
	& & & & & & I_{m_k}
\end{pmatrix}
\]


易知分块初等矩阵是可逆阵,其中第三类分块初等矩阵的行列式的值等于1.


\begin{theorem}
	\begin{enumerate}[(1)]
		\item 分块初等矩阵是非奇异阵.
		\[P_{ij}^{-1} = P_{ij}',\quad  P_{i}(M)^{-1} = P_i(M^{-1}),\quad T_{ij}(M)^{-1} = T_{ij}(-M)\]
		\item $|P_{ij}| = (-1)^l$,其中
		\[l = m_im_j +(m_i+m_j)\sum_{i<r<j}m_r\]
		\[|P_i(M)| = |M|,\qquad |T_{ij}(M)| = 1\]
		\item 分块初等行(列)变换等价于左乘(右乘)对应的分块初等矩阵.
		\item 第三类分块初等变换不改变行列式的值.
	\end{enumerate}
\end{theorem}
\begin{proof}
	(4)该性质并不能直接由行列式性质得到,而是根据(3)以及矩阵乘积的行列式等于行列式的乘积得到.
\end{proof}




\begin{theorem}
	设$M = \begin{pmatrix}
		A&B\\
		C&D
	\end{pmatrix}$
	其中$A$为$m$阶方阵,$D$为$n$阶方阵.
	\begin{enumerate}[(1)]
		\item 若$A$可逆,则$|M| = |A|\cdot |D-CA^{-1}B|$.
		\item 若$D$可逆,则$|M| = |D|\cdot |A - BD^{-1}C|$.
		\item 若$A,D$均可逆,则有
		\[|A|\cdot |D-CA^{-1}B| =  |D|\cdot |A - BD^{-1}C| \qquad \text{降阶公式}\]
	\end{enumerate}
\end{theorem}
\begin{proof}
	\begin{enumerate}[(1)]
		\item 由于$A$可逆,可通过第三类分块初等变换将$C$的位置消为$O$(并且不改变行列式的值).
		\[\begin{pmatrix}
			A&B\\
			C&D
		\end{pmatrix} \longrightarrow  \begin{pmatrix}
		A&B\\
		O&D - CA^{-1}B
		\end{pmatrix}  = |A|\cdot |D-CA^{-1}B|\]
		\item 也是同理,利用$D$可逆,将$B$的位置消为$O$即可得到.
		\item 根据(1)(2)显然成立.
	\end{enumerate}
\end{proof}




\begin{example}
	计算下列矩阵的行列式值：
	
	\[
	M = \begin{pmatrix}
		a_1^2 & a_1 a_2 + 1 & \cdots & a_1 a_n + 1 \\
		a_2 a_1 + 1 & a_2^2 & \cdots & a_2 a_n + 1 \\
		\vdots & \vdots & \ddots & \vdots \\
		a_n a_1 + 1 & a_n a_2 + 1 & \cdots & a_n^2
	\end{pmatrix}.
	\]
\end{example}
\begin{note}
	观察到除主对角线外都有+1,故可将其写为$-I_n + (a_ia_j+1)_{n\times n}$形式.对于后面的这个矩阵可以写为两个相乘的形式,即
	\[(a_ia_j+1)_{n\times n} = \begin{pmatrix}
		a_1 & 1\\
		a_2 & 1\\
		\vdots&\vdots\\
		a_n&1
	\end{pmatrix} \begin{pmatrix}
	a_1&a_2&\cdots&a_n\\
	1&1&\cdots &1
\end{pmatrix}\]
为了利用降阶公式可以写为
\[-I_n + \begin{pmatrix}
	a_1 & 1\\
	a_2 & 1\\
	\vdots&\vdots\\
	a_n&1
\end{pmatrix} \begin{pmatrix}
	a_1&a_2&\cdots&a_n\\
	1&1&\cdots &1
\end{pmatrix} = -I_n -  \begin{pmatrix}
a_1 & 1\\
a_2 & 1\\
\vdots&\vdots\\
a_n&1
\end{pmatrix} (-I_2)^{-1}\begin{pmatrix}
a_1&a_2&\cdots&a_n\\
1&1&\cdots &1
\end{pmatrix} \]
\end{note}

\begin{solution}
	将 $M$ 化为
	
	\begin{align*}
		M &= -I_n + \begin{pmatrix}
			a_1 & 1 \\
			a_2 & 1 \\
			\vdots & \vdots \\
			a_n & 1
		\end{pmatrix}
		I_2^{-1}
		\begin{pmatrix}
			a_1 & a_2 & \cdots & a_n \\
			1 & 1 & \cdots & 1
		\end{pmatrix}\\
		&=-I_n -  \begin{pmatrix}
			a_1 & 1\\
			a_2 & 1\\
			\vdots&\vdots\\
			a_n&1
		\end{pmatrix} (-I_2)^{-1}\begin{pmatrix}
			a_1&a_2&\cdots&a_n\\
			1&1&\cdots &1
		\end{pmatrix}
	\end{align*}

设$\begin{pmatrix}
	A&B\\
	C&D
\end{pmatrix}$,其中
\[A = -I_2,\quad D = -I_n,\quad  C = B' = \begin{pmatrix}
	a_1 & 1 \\
	a_2 & 1 \\
	\vdots & \vdots \\
	a_n & 1
\end{pmatrix}\]
	由降阶公式得到
	\begin{align*}
		|M|=|A||M| &=  \left|- I_n\right| \left| -I_2 - \begin{pmatrix}
			a_1 & a_2 & \cdots & a_n \\
			1 & 1 & \cdots & 1
		\end{pmatrix}
		(-I_n)^{-1}
		\begin{pmatrix}
			a_1 & 1 \\
			a_2 & 1 \\
			\vdots & \vdots \\
			a_n & 1
		\end{pmatrix} \right|\\
		&= (-1)^n \begin{vmatrix}
			\sum_{i=1}^{n}a_i^2-1& \sum_{i=1}^{n}a_i\\
			\sum_{i=1}^{n}a_i & n-1
		\end{vmatrix}\\
		&= (-1)^n \left( (n-1) \left( \sum_{i=1}^n a_i^2-1 \right) - \left( \sum_{i=1}^n a_i \right)^2 \right).
	\end{align*}
\end{solution}


我们可以用相同的方法求分块矩阵的逆矩阵.
\begin{example}
	已知 $A$ 和 $D$ 是可逆阵,求下列分块矩阵的逆阵
	
	\[
	\begin{pmatrix}
		A & B \\
		O & D
	\end{pmatrix}.
	\]
\end{example}
\begin{solution}	
	设 $A, D$ 分别是 $m, n$ 阶矩阵.对下列分块矩阵进行初等变换,即将第二行左乘以 $-BD^{-1}$ 加到第一行上去：
	\[
	\begin{pmatrix}
		\begin{array}{cc:cc}
			A & B & I_m & O \\
			O & D & O & I_n
		\end{array}
	\end{pmatrix}
	\rightarrow
	\begin{pmatrix}
		\begin{array}{cc:cc}
			A & O & I_m & -BD^{-1} \\
			O & D & O & I_n
		\end{array}
	\end{pmatrix},
	\] 
	
	再用 $A^{-1}$ 和 $D^{-1}$ 分别左乘以第一行及第二行得到：
	\[
	\begin{pmatrix}
		\begin{array}{cc:cc}
			I_m & O & A^{-1} & -A^{-1}BD^{-1} \\
			O & I_n & O & D^{-1}
		\end{array}
	\end{pmatrix}.
	\]
	
	因此原矩阵的逆阵为
	
	\[
	\begin{pmatrix}
		A^{-1} & -A^{-1}BD^{-1} \\
		O & D^{-1}
	\end{pmatrix}.
	\]
\end{solution}


\section{Cauchy-Binet公式}

我们在本章第三节定理\ref{theorem:2.2}中,证明了方阵乘积的行列式等于各方阵行列式之积.现在的问题是：如果 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times m$ 矩阵,$AB$ 是 $m$ 阶方阵,则行列式 $|AB|$ 应该等于什么？Cauchy-Binet（柯西–毕内）公式回答了这个问题.它可以看成是矩阵乘法的行列式定理的推广.

\begin{theorem}[Cauchy-Binet公式]
	设 $A = (a_{ij})$ 是 $m \times n$ 矩阵,$B = (b_{ij})$ 是 $n \times m$ 矩阵.$A \begin{pmatrix}
		i_1 & \cdots & i_s \\
		j_1 & \cdots & j_s
	\end{pmatrix}$ 表示 $A$ 的一个 $s$ 阶子式,它由 $A$ 的第 $i_1, \cdots, i_s$ 行与第 $j_1, \cdots, j_s$ 列交点上的元素按原次序排列组成的行列式.同理可定义 $B$ 的 $s$ 阶子式.
	\begin{enumerate}[(1)]
		\item 若 $m > n$,则必有 $|AB| = 0$；
		\item 若 $m \leq n$,则必有
		\[
		|AB| = \sum_{1 \leq j_1 < j_2 < \cdots < j_m \leq n} A \begin{pmatrix}
			1 & 2 & \cdots & m \\
			j_1 & j_2 & \cdots & j_m
		\end{pmatrix} B \begin{pmatrix}
			j_1 & j_2 & \cdots & j_m \\
			1 & 2 & \cdots & m
		\end{pmatrix}.
		\]
	\end{enumerate}
\end{theorem}
\begin{proof}
	令 $C = \begin{pmatrix}
		A & O \\
		-I_n & B
	\end{pmatrix}$.我们将用不同的方法来计算行列式 $|C|$.
	
	首先,对 $C$ 进行第三类分块初等变换得到矩阵 $M = \begin{pmatrix}
		O & AB \\
		-I_n & B
	\end{pmatrix}$.实际上,$M$ 可写为
	
	\[
	M = \begin{pmatrix}
		I_m &  A \\
		O & I_n 
	\end{pmatrix} C,
	\]
	
	因此 $|M| = |C|$.用 Laplace 定理来计算 $|M|$,按前 $m$ 行展开得
	
	\[
	|M| = (-1)^{(n+1+1+n+2+\cdots+n+m)+(1+2+\cdots+m)} \left| -I_n \right| |AB| = (-1)^{n(m+1)} |AB|.
	\]
	再来计算 $|C|$,用 Laplace 定理按前 $m$ 行展开.
	
	这时若 $m > n$,则前 $m$ 行中任意一个 $m$ 阶子式至少有一列全为零,因此行列式值等于零,即 $|AB| = 0$.
	
	若 $m \le n$,则由 Laplace 定理得
	\[
	|C| = \sum_{1 \leq j_1 < j_2 < \cdots < j_m \leq n} A \begin{pmatrix}
		1 & 2 & \cdots & m \\
		j_1 & j_2 & \cdots & j_m
	\end{pmatrix} B \begin{pmatrix}
		j_1 & j_2 & \cdots & j_m \\
		1 & 2 & \cdots & m
	\end{pmatrix}.
	\]
	
	其中 $\hat{C} \begin{pmatrix}
		1 & 2 & \cdots & m \\
		j_1 & j_2 & \cdots & j_m
	\end{pmatrix}$ 是 $A \begin{pmatrix}
		1 & 2 & \cdots & m \\
		j_1 & j_2 & \cdots & j_m
	\end{pmatrix}$ 在矩阵 $C$ 中的代数余子式.
	
	显然
	
	\[
	\hat{C} \begin{pmatrix}
		1 & 2 & \cdots & m \\
		j_1 & j_2 & \cdots & j_m
	\end{pmatrix} = (-1)^{\frac{1}{2}m(m+1) + (j_1 + j_2 + \cdots + j_m)} \left| -e_{i_1}, -e_{i_2}, \cdots, -e_{i_{n-m}}, B \right|,
	\]
	
	其中 $i_1, i_2, \cdots, i_{n-m}$ 是 $C$ 中前 $n$ 列去掉 $j_1, j_2, \cdots, j_m$ 列后余下的列序数.$e_{i_1}, e_{i_2}, \cdots, e_{i_{n-m}}$ 是相应的 $n$ 维标准单位列向量.记
	
	\[
	|N| = \left| -e_{i_1}, -e_{i_2}, \cdots, -e_{i_{n-m}}, B \right|,
	\]
	
	现来计算 $|N|$.$|N|$ 用 Laplace 定理按前 $n-m$ 列展开.注意只有一个子式非零,其值等于 $|-I_{n-m}| = (-1)^{n-m}$.而这个子式的余子式为
	
	\[
	B \begin{pmatrix}
		j_1 & j_2 & \cdots & j_m \\
		1 & 2 & \cdots & m
	\end{pmatrix}.
	\]
	
	因此
	
	\[
	|N| = (-1)^{(n-m)+(i_1+i_2+\cdots+i_{n-m})+(1+2+\cdots+n-m)} B \begin{pmatrix}
		j_1 & j_2 & \cdots & j_m \\
		1 & 2 & \cdots & m
	\end{pmatrix}.
	\]
	
	注意到 $(i_1 + i_2 + \cdots + i_{n-m}) + (j_1 + j_2 + \cdots + j_m) = 1 + 2 + \cdots + n$($i,j$互为余指标).综合上面的结论,通过简单计算(只需证明(-1)的指数的奇偶性相同即可,即证两数之和为偶数)得到
	
	\[
	|AB| = \sum_{1 \leq j_1 < j_2 < \cdots < j_m \leq n} A \begin{pmatrix}
		1 & 2 & \cdots & m \\
		j_1 & j_2 & \cdots & j_m
	\end{pmatrix} B \begin{pmatrix}
		j_1 & j_2 & \cdots & j_m \\
		1 & 2 & \cdots & m
	\end{pmatrix}. 
	\]
\end{proof}

下面的定理是 Cauchy-Binet 公式的进一步推广,它告诉我们如何求矩阵乘积的 $r$ 阶子式.


\begin{theorem}
	设 $A = (a_{ij})$ 是 $m \times n$ 矩阵,$B = (b_{ij})$ 是 $n \times m$ 矩阵,$r$ 是一个正整数且 $r \leq m$.
	\begin{enumerate}[(1)]
		\item 若 $r > n$,则 $AB$ 的任意一个 $r$ 阶子式等于零；
		\item 若 $r \leq n$,则 $AB$ 的 $r$ 阶子式
		\[
		AB \begin{pmatrix}
			i_1 & i_2 & \cdots & i_r \\
			j_1 & j_2 & \cdots & j_r
		\end{pmatrix}
		= \sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n} A \begin{pmatrix}
			i_1 & i_2 & \cdots & i_r \\
			k_1 & k_2 & \cdots & k_r
		\end{pmatrix} B \begin{pmatrix}
			k_1 & k_2 & \cdots & k_r \\
			j_1 & j_2 & \cdots & j_r
		\end{pmatrix}.
		\]
	\end{enumerate}
\end{theorem}
\begin{proof}
	 设 $C = AB$,则 $C = (c_{ij})$ 是 $m$ 阶矩阵且
	
	\[
	c_{ij} = a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{in}b_{nj}.
	\]
	
	因此
	
	\[
	C \begin{pmatrix}
		i_1 & i_2 & \cdots & i_r \\
		j_1 & j_2 & \cdots & j_r
	\end{pmatrix} = \begin{vmatrix}
	\begin{pmatrix}
		a_{i_1 1} & a_{i_1 2} & \cdots & a_{i_1 n} \\
		a_{i_2 1} & a_{i_2 2} & \cdots & a_{i_2 n} \\
		\vdots & \vdots & \ddots & \vdots \\
		a_{i_r 1} & a_{i_r 2} & \cdots & a_{i_r n}
	\end{pmatrix}
	\begin{pmatrix}
		b_{1 j_1} & b_{1 j_2} & \cdots & b_{1 j_r} \\
		b_{2 j_1} & b_{2 j_2} & \cdots & b_{2 j_r} \\
		\vdots & \vdots & \ddots & \vdots \\
		b_{n j_1} & b_{n j_2} & \cdots & b_{n j_r}
	\end{pmatrix}.
	\end{vmatrix}
	\]
	
	由上述定理(Cauchy-Binet公式)可知：当 $r > n$ 时,
	
	\[
	C \begin{pmatrix}
		i_1 & i_2 & \cdots & i_r \\
		j_1 & j_2 & \cdots & j_r
	\end{pmatrix} = 0;
	\]
	
	当 $r \leq n$ 时,
	
	\[
	C \begin{pmatrix}
		i_1 & i_2 & \cdots & i_r \\
		j_1 & j_2 & \cdots & j_r
	\end{pmatrix} = \sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n} A \begin{pmatrix}
		i_1 & i_2 & \cdots & i_r \\
		k_1 & k_2 & \cdots & k_r
	\end{pmatrix} B \begin{pmatrix}
		k_1 & k_2 & \cdots & k_r \\
		j_1 & j_2 & \cdots & j_r
	\end{pmatrix}. 
	\]
\end{proof}




\begin{definition}[$r$阶主子式]
	矩阵 $A$ 的子式
	
	\[
	A \begin{pmatrix}
		i_1 & i_2 & \cdots & i_r \\
		j_1 & j_2 & \cdots & j_r
	\end{pmatrix}
	\]
	
	如果满足条件 $i_1 = j_1, i_2 = j_2, \cdots, i_r = j_r$,则称之为主子式.
\end{definition}


\begin{corollary}
	设 $A$ 是 $m \times n$ 阶实矩阵,则矩阵 $AA'$ 的任一主子式都非负.
\end{corollary}
\begin{proof}
	\begin{enumerate}[(1)]
		\item 若$r > n$,则 $AA'$ 的任一 $r$ 阶子式都等于零,结论成立.
		\item 若 $r \leq n$,则由上面的定理得到
		\begin{align*}
			AA' \begin{pmatrix}
				i_1 & i_2 & \cdots & i_r \\
				i_1 & i_2 & \cdots & i_r
			\end{pmatrix} &=\sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n}A \begin{pmatrix}
			i_1 & i_2 & \cdots & i_r \\
			k_1 & k_2 & \cdots & k_r
			\end{pmatrix} A'\begin{pmatrix}
			k_1 & k_2 & \cdots & k_r\\
			i_1 & i_2 & \cdots & i_r
			\end{pmatrix}\\
			&= \sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n} 
			 A \begin{pmatrix}
				i_1 & i_2 & \cdots & i_r \\
				k_1 & k_2 & \cdots & k_r
			\end{pmatrix} ^2 \geq 0.
		\end{align*}
	\end{enumerate}
\end{proof}



下面介绍Cauchy-Binet公式的两个重要应用．它们分别是著名的Lagrange（拉格朗日）恒等式和Cauchy-Schwarz（柯西-许瓦兹）不等式．这两个结论也可以用其他方法证明,但用矩阵方法显得非常简洁,


\begin{corollary}[Lagrange 恒等式]
	证明 Lagrange 恒等式 ($n \geq 2$)：
	
	\[
	\left( \sum_{i=1}^{n} a_i^2 \right) \left( \sum_{i=1}^{n} b_i^2 \right) - \left( \sum_{i=1}^{n} a_i b_i \right)^2 = \sum_{1 \leq i < j \leq n} (a_i b_j - a_j b_i)^2.
	\]
\end{corollary}
\begin{proof}
	左边的式子等于
	
	\[
	\left| \begin{matrix}
		\sum_{i=1}^{n} a_i^2 & \sum_{i=1}^{n} a_i b_i \\
		\sum_{i=1}^{n} a_i b_i & \sum_{i=1}^{n} b_i^2
	\end{matrix} \right|,
	\]
	
	这个行列式对应的矩阵可化为
	
	\[
	\begin{pmatrix}
		a_1 & a_2 & \cdots & a_n \\
		b_1 & b_2 & \cdots & b_n
	\end{pmatrix}
	\begin{pmatrix}
		a_1 & b_1 \\
		a_2 & b_2 \\
		\vdots & \vdots \\
		a_n & b_n
	\end{pmatrix}.
	\]
	
	用 Cauchy-Binet 公式得
	\begin{align*}
		\begin{vmatrix}
			\sum_{i=1}^{n} a_i^2 & \sum_{i=1}^{n} a_i b_i \\
			\sum_{i=1}^{n} a_i b_i & \sum_{i=1}^{n} b_i^2
		\end{vmatrix}  &=\sum_{1 \leq i < j \leq n}\begin{vmatrix}
			a_i & a_j \\
			b_i & b_j
		\end{vmatrix}\begin{vmatrix}
			a_i & b_i \\
			a_j & b_j
		\end{vmatrix}\\
		  &= \sum_{1 \leq i < j \leq n}  \begin{vmatrix}
			a_i & a_j \\
			b_i & b_j
		\end{vmatrix} ^2 \\
		&= \sum_{1 \leq i < j \leq n} (a_i b_j - a_j b_i)^2.
	\end{align*}
\end{proof}





\begin{corollary}[Cauchy-Schwarz不等式]
	设 $a_i, b_i$ 都是实数,证明 Cauchy-Schwarz 不等式：
	
	\[
	\left( \sum_{i=1}^{n} a_i^2 \right) \left( \sum_{i=1}^{n} b_i^2 \right) \geq \left( \sum_{i=1}^{n} a_i b_i \right)^2.
	\]
\end{corollary}
\begin{proof}
	根据拉格朗日恒等式可知右边总非负,即得结论. 
\end{proof}



\begin{corollary}
	设$A,B$为$n$阶方阵,则
	\[(AB)^* = B^* A^*\]
\end{corollary}
\begin{proof}
	只需证明两边第$(i,j)$元素相同即可.
	
	$(AB)^*$的第$(i,j)$元素 = $AB$的第$(j,i)$元素的代数余子式.
	
	即为
	\begin{align*}
		(-1)^{j+i}AB\begin{pmatrix}
			1\cdots \hat{j}\cdots n\\
			1\cdots \hat{i}\cdots n\\
		\end{pmatrix}
	\end{align*}
	根据Cauchy-Binet 公式,上式为
	\begin{align*}
		(-1)^{j+i}\sum_{k=1}^{n} A\begin{pmatrix}
			1\cdots \hat{j}\cdots n\\
			1\cdots \hat{k}\cdots n\\
		\end{pmatrix}A\begin{pmatrix}
		1\cdots \hat{k}\cdots n\\
		1\cdots \hat{i}\cdots n\\
		\end{pmatrix} &= \sum_{k=1}^{n} A_{jk}B_{ki}\\
		&=A^*\text{的第}j\text{列}\cdot B^*\text{的第}i\text{行}\\
		&= B^* \cdot A^* \text{的第}(i,j)\text{元素}
	\end{align*}
\end{proof}
\begin{note}
	$\hat{j}$表示$j$不在$1\sim n$中.
\end{note}






\begin{note}
	性质总结:设$A,B$都是$n$阶方阵.
	\begin{itemize}
		\item 转置性质
		\begin{enumerate}[(1)]
			\item $(A')' = A$;
			\item $(AB)' = B'A'$;
			\item $(cA)' = cA'$;
			\item $|A'| = |A|$.
		\end{enumerate}
		\item 逆阵的性质
		\begin{enumerate}[(1)]
			\item 若逆阵存在一定唯一.
			\item $(A^{-1})^{-1} = A$;
			\item $(AB)^{-1} = B^{-1}A^{-1}$;
			\item $(cA)^{-1} = c^{-1}A^{-1},\quad (c\neq 0)$ ;
			\item $|A^{-1}| = |A|^{-1}$;
			\item $(A')^{-1} = (A^{-1})'$;
			\item 乘法消去律和整性对可逆阵成立.
		\end{enumerate}
		\item 伴随矩阵的性质(阶数$n\ge 2$)
		\begin{enumerate}[(1)]
			\item 伴随矩阵一定存在,且满足
			\[AA^* = A^*A = |A|I_n\]
			\item \[(A^*)^*\begin{cases}
				|A|^{n-2}\cdot A ,\quad (n\ge 3)\\
				A,\quad (n=2)
			\end{cases}\]
			\item $(AB)^* = B^*A^*$;
			\item $(cA)^{*} = c^{n-1}A^*$;
			\item $|A^*| = |A|^{n-1}$;
			\item $(A')^* = (A^*)'$;
			\item $(A^{-1})^* = (A^*)^{-1}$.
		\end{enumerate}
	\end{itemize}
\end{note}


\begin{proof}
	证明伴随性质的第(2)和第(5)条.
	\begin{itemize}
		\item  \[(A^*)^*\begin{cases}
			|A|^{n-2}\cdot A ,\quad (n\ge 3)\\
			A,\quad (n=2)
		\end{cases}\]
		\begin{itemize}
			\item 当$n=2$时,根据推论\ref{corollary:2.1}可知,
			\[A = \begin{pmatrix}
				a&b\\
				c&d
			\end{pmatrix},\quad A^* = \begin{pmatrix}
			d&-b\\
			-c&a
			\end{pmatrix},\quad (A^*)^* = \begin{pmatrix}
			a&b\\
			c&d
			\end{pmatrix}\]
			\item 当$n\ge 3$,若$A$为非奇异阵时,$A^* = |A|\cdot A^{-1}$;
			
			\[(A^*)^* = \left(|A| \cdot A^{-1}\right)^*=|A|^{n-1}(A^{-1})^* = |A|^{n-1}(A^{*})^{-1} = |A|^{n-2}A\]
			
			若$A$为奇异阵时,只需证$(A^*)^* = O$即可.同样存在奇异阵$P,Q$使得
			\[A = P\begin{pmatrix}
				I_r&O\\
				O&O
			\end{pmatrix}Q\]
			相抵标准型的双重伴随矩阵为
			\[\begin{pmatrix}
				I_r&O\\
				O&O
			\end{pmatrix}^{**} = \begin{cases}
			\begin{pmatrix}
				I_r&O\\
				O&O
			\end{pmatrix},\quad n=2,r=1\\
			I_n,\quad r = n\\
			O,\quad else
			\end{cases}\]
			
			于是$(A^*)^* = O$.
		\end{itemize}
		\item $|A^*| = |A|^{n-1}$;
		\begin{itemize}
			\item 若$A$可逆,由于$A^* = |A|A^{-1}$,两边取行列式得到
			\[|A^*| = \begin{vmatrix}
				|A|A^{-1}
			\end{vmatrix} = |A|^{n}\cdot |A|^{-1} = |A|^{n-1}\]
			\item 若$A$奇异,则只需证明$|A^*| = 0 =|A|^{n-1}$即可.
			
			存在非奇异矩阵$P,Q$使得
			\[A = P\begin{pmatrix}
				I_r&O\\
				O&O
			\end{pmatrix}Q\footnote{本来是 $PAQ =\begin{pmatrix}
				I_r&O\\
				O&O
			\end{pmatrix}$,取逆后即可得到.}  \]
		相抵标准型的伴随矩阵为
		\[\begin{pmatrix}
			I_r&O\\
			O&O
		\end{pmatrix}^* = \begin{cases}
		O,\quad r\le n-2\\
		\begin{pmatrix}
			O&O\\
			O&1
		\end{pmatrix},\quad r = n-1\\
		I_n,\quad r=n
	\end{cases}\]
	特别地,当$r<n$时,
	\[\begin{vmatrix}
		\begin{pmatrix}
			I_r&O\\
			O&O
		\end{pmatrix}^*
	\end{vmatrix} = 0,\]
	\begin{align*}
		 |A^*| & = \begin{vmatrix}
		 	\left(P\begin{pmatrix}
		 		I_r&O\\
		 		O&O
		 	\end{pmatrix}Q \right)^*
		 \end{vmatrix}\\
		 &=\begin{vmatrix}
		 	Q^* \begin{pmatrix}
		 		I_r&O\\
		 		O&O
		 	\end{pmatrix}^*P^*
		 \end{vmatrix}\\
		 &=|Q^*|\begin{vmatrix}
		 	\begin{pmatrix}
		 		I_r&O\\
		 		O&O
		 	\end{pmatrix}^*
		 \end{vmatrix}|P^*|\\
		 &=0
	\end{align*}
		\end{itemize}
	\end{itemize}
\end{proof}
















